Qué, porqué y cómo del XMPP por BOSH

Si estás leyendo esto seguro que alguna vez has utilizado un “chat”. Los encontramos de las maneras más variopintas, desde desde simples chats de dos personas (punto a punto se podría llamar), en páginas webs con decenas de personas, el ya bastante obsoletillo IRC, el malvado MSN Messenger…. alguno incluso habrá infectado a alguien con un troyano el cual trae una herramienta de chat para hablar con tu víctima. Como ves, existen infinidad de herramientas y cada una con sus normas y sus características. Yo os voy a hablar del sistema definitivo, un sistema potente, estandar y sobre todo libre. Saludemos a XMPP.

¿Qué es XMPP y por qué usar XMPP?

Es un protocolo. Como a muchos eso os dejará igual voy a tratar de explicar que es esto y te darás cuenta del por qué es necesario que sea libre.

En informática un protocolo son una serie de normas para que dos máquinas sean capaces de entenderse. Esto nos da la posibilidad de que dos (o más) máquinas (o programas dentro de una máquina) puedan compartir información, dialogar entre ellas, discutir y llegar a acuerdos, etc. Sí, las máquinas hablan entre ellas, y mucho. Son unas cotorras de tomo y lomo lo que pasa es que no nos damos cuenta. Nosotros sólo vemos el resultado de toda era “burocracia” entre máquinas. Aquellos que nos siguen desde hace bastante igual se acuerdan de la dramatización que hicimos sobre el protocolo DNS, pues esto es igual. Cuando dos máquinas conocen el protocolo son capaces de trabajar conjuntamente pero si una usa un protocolo extraño pues le costará encontrar otras máquinas con la que trabajar. Un símil entre protocolo y cerrado y abierto con la realidad sería el siguiente. Quieres aprender un idioma, vas a una academia donde te dan unas clases pero tienes la posibilidad de ir a la biblioteca pública y coger libros para aprenderlo mejor. También puedes buscar por internet e incluso preguntar a gente que gustosamente te ayudará (siempre y cuando no seas muy cansino claro :P). En resumidas cuentas, nadie te pondrá trabas a que aprendas ese idioma.

En cambio, si quieres aprender un idioma pero para conocerlo tienes que entrar en una secta y no hay ningún libro ni persona fuera de esa secta que habla sobre el idioma pues lo vas a tener bastante complicado. Esto equivale a un protocolo cerrado.

Quizá te ronda por la cabeza que ¿Quién en su sano juicio querría usar un protocolo cerrado? Pues en su sano juicio supongo que muy pocos pero el problema es que los usamos sin saberlo (la ignorancia, ese gran arma de los “poderosos”). Como estamos hablando de protocolos de mensajería instantánea os voy a poner un ejemplo de este tipo que seguro que conoces: MSN Messenger. Es un protocolo cerrado y sucio. También si te hablo de uno que usa XMPP igual te suena, GTalk. Podría iniciar un flame war diciendo lo malos que son los de Microsoft y lo bien que me caen los de Google pero eso ya para otro día.

Una duda que puede surgir es que si el protocolo de MSN Messenger es cerrado, ¿Cómo hay tantos programas libres ajenos a la secta que lo “entienden”? En informática esto se llama ingeniería inversa. Consiste en capturar mensajes y volver a enviarlo. observar qué pasa y al cabo de muchas horas ir comprendiendo cómo funciona. Un símil sería como irte a china sin saber nada de chino. Con el tiempo acabarás aprendiendo el idioma (que remedio) relacionando palabras que dicen con acciones que hacen luego. Nunca aprenderás chino como si te explicaran la gramática y todo eso, pero acabarás aprendiendo lo suficiente como para manejarte. Y con el ejemplo de la secta, como un día se le ocurra cambiar cosas del idioma nos han fastidiado. Nos toca volver a hacer todo el trabajo.

Requiere de mucho más tiempo comprender un protocolo de esos que hacer un programa que use el protocolo. De ahí que sea tan importante que el protocolo sea libre, que a nadie le gusta perder el tiempo.

Todo esto de poner facilidades para que los demás te entiendan puede llevar a otra cuestión. ¿Y si no quiero que nadie sepa lo que estoy comunicando? Por ejemplo, yo no quiero que sepan lo que hablo con la gente. Me alegra que me hagas esa pregunta 😛
Eso no forma parte del protocolo sino del canal. No voy a explicarlo porque no viene a cuento pero la solución es usar un canal seguro que en resumidas cuentas en cifrar la información. He de decir que el que un protocolo sea cerrado no es sinónimo (ni mucho menos) de seguridad. La información viaja intacta. Mientras el protocolo cerrado de microsoft es totalmente inseguro (ya que no va cifrado) el xmpp siendo libre es totalmente seguro ya que sí va cifrado. Esto lo demostramos un día cuando crackeamos nuestro wifi y sabíamos lo que hablaba por el messenger. Eso con xmpp no hubiera sido posible (cuantas referencias estoy haciendo hoy). Creo que han quedado explicados los puntos “Qué es” y “Por qué usarlo”. Pasemos a centrarnos en XMPP.

Cómo funciona XMPP

XMPP funciona a base de enviar XML. XML es una manera estándar de enviar información y que a día de hoy está hasta en la sopa aunque, de nuevo, no nos demos cuenta. Por ejemplo, el HTML (lo de las páginas web) es XML. Voy a explicar brevemente como va esto del XML (es realmente sencillo)

<cosa atributo1=valor1>Cotenido</cosa>

la palabra “cosa” se denomina tag e indica el tipo de elemento que es. El resto de campos son bastantes intuitivos. Un ejemplo real de mensaje XMPP sería el siguiente

<message from="[email protected]" to="[email protected]">Ey tío que pasaaaa</message>

Sobra explicarlo pero esto envía un mensaje de [email protected] a [email protected] con el contenido “Ey tío que pasaaa”

En XMPP existen 3 tipos de elementos diferentes: message, presence e iq
Message: Son los mensajes que se envían los usuarios entre sí.
Presence: Los eventos de presencia de usuarios. Cuando se desconectan o conectan, cuando cambian de estado, de nombre….
Iq: Sirve para enviar comandos internos. Por ejemplo para iniciar una nueva conexión, informar de errores y cosas que no tienen nada que ver con los usuarios.

Pero antes de poder conectarte te tienes que conectar, verdad? Eso se hace al principio (qué listo) y en este proceso el cliente y el servidor negocian a través del protocolo cómo se sincronizarán, el cifrado que usarán y todas esas cosas.

En el título comentaba algo de BOSH. Eso de BOSH es una pasarela para poder establecer una conexión a un servidor XMPP desde HTTP. Esto es necesario por lo siguiente.
XMPP es una conexión persistente. Se mantiene la conexión desde el principio hasta el final, y mientras se envían todos los mensajes que quieran.
HTTP es una conexión de petición y respuesta. Esto es que tu te conectas y haces una petición. El servidor responde y se termina la conexión.

Con este método haces una petición y estas a la espera de que el servidor responda y en ese momento lanzas otra. Hay otro método (polling) que consiste en enviar muchas peticiones cortitas (cada medio segundo por ejemplo) pero personalmente prefiero la primera.
Esta tarea requiere de una pequeña sincronización. Esta sincronización se hace mediante un numerito que le pasamos en cada petición y que se debe ir incrementando después de cada respuesta NO vacía, luego explico que es eso.

Siempre debemos tener una conexión abierta hacia el servidor. Podemos conectarnos al servidor de dos maneras:
Enviando una petición nuestra (por ejemplo queremos enviar un mensaje a un contacto) o escuchando (nos quedamos escuchando al servidor hasta que nos diga algo).
Sólo podemos tener dos conexiones abiertas y en caso de abrir una tercera o un numero de sincronización incrementado incorrectamente provocada que finalice la sesión (el servidor nos llama violadores y nos manda a paseo).
Voy a explicar qué es un mensaje vacío y la relación que tiene con el número de sincronización. El numerito en cuestión se llama RID y debe ser generado de manera aleatoria. Es importante tener un buen algoritmo que genere un número lo más difícil posible de precedir ya que teniendo el RID junto al SID (un numero que identifica la conexión y se crea en ese momento) alguien podría hacerse pasar por nosotros ya que si envias un SID y un RID correcto la cosa va a funcionar (al ser por HTTP el servidor no tiene manera de conocer de dónde viene la petición). Describo un ejemplo.

Inicio sesión y estoy a la escucha de un mensaje del servidor. Estoy usando una conexión.
Decido que a mi amigo “Prueba” quiero saludarle así que le escribo “Hola”. Esto genera un objeto message que se envía al servidor. En este instante estoy usando dos conexiones. Si se me ocurre enviar otra cosa el servidor nos cerrará sesión y adiós muy buenas. Lo que se debe hacer en este momento es cerrar la primera conexión, que devolverá un mensaje vacío. Entonces NO tenemos que incrementar el RID.
Nuestro amigo Prueba nos responde diciendo “Eyyyy” y el servidor nos lo hace saber, creando un message y a través de la conexión creada nos lo envía. Como dije antes, en HTTP una vez recibida la respuesta se finaliza la conexión. En este momento debemos lanzar una petición para escuchar pero como sí recibimos un mensaje incrementamos el RID. Si no lo hacemos ya sabes lo que pasa. Remarco que mensaje no es lo mismo que message. Message es un tipo de mensaje como también lo es presence o iq.

Esa es la parte complicadilla. Conceptualmente no es complejo ni mucho menos pero crear un algoritmo pues ya tiene algo de tela. Si os interesa saber más hice un plugin jQuery (en javascript) y que en apenas 200 líneas es capaz de manejar ese protocolo y facilitar manejadores de eventos. Puedes ver un poco de documentación en

La página oficial donde está todo documentado es http://xmpp.org/ pero está todo en inglés. Yo he intentado explicarlo en castellano, pues hay mucha gente que no se lleva muy bien con el inglés e igual esto ayuda.

You may also like...

19 Responses

  1. Bimbo dice:

    Wa. Es que solo con el podcast no te valía eh? XD
    Impresionante, ¡hasta lo he entendido! A veces me averguenzo de formar equipo contigo, ¡qué nivel! 😉

  2. Maxpowel dice:

    Jaja gracias, me alegra que alguien se lea los tocho-posts 😛

  3. Gracias por el post, la verdad es que le he entendido bien, además de que llego a mi mente la representación DNS que hicieron por ahí en un podcast jejeje. Donde puedo ver el jQuery para ver un ejemplo de lo que se esta hablando.

    Saludos.

  4. Maxpowel dice:

    El código puedes acceder a él desde google code http://code.google.com/p/wixet/source/browse/branch/wixet3rd/js/jquery.xmpp.js y para probarlo ahora mismo solo puedes hacerlo el chat de wixet

  5. Pedro dice:

    Hola Max! muy buen post!!!! quiero implementar en mi web un chat y me voy a fijar en el xmpp/bosh :D!!, sabes dónde podría conseguir los ejemplos de código fuente del cliente y del servidor. Querría un chat simple cliente-agente. Gracias! ;D

  6. Maxpowel dice:

    Como software servidor uso Openfire que es software libre, muy bueno y extremadamente fácil de instalar y configurar.

    El software cliente ya depende más de ti. Yo he hecho este http://code.google.com/p/wixet/source/browse/branch/wixet3rd/js/jquery.chat-jabber.js pero ademas de necesitar jquery.xmpp.js también depende de jquery-ui, un editor de texto http://code.google.com/p/wixet/source/browse/branch/wixet3rd/js/jquery.editor.js, y un gestor de ventanas http://code.google.com/p/wixet/source/browse/branch/wixet3rd/js/jquery.window.4.03.js

    Y por supuesto necesitas redireccionar desde apache; básicamente poner esto en tu archivo de configuracion de pache

    ProxyRequests On
    ProxyPass /http-bind http://127.0.0.1:7070/http-bind/

    Esto lo que hace es redireccionar las peticiones al servidor jabber.

  7. nemo dice:

    gracias, :) con la noticia de que skype fue comprada por mocosoft decidi ver que tenie para ofrecer una vez mas el software libre :) vamos XMPP, muy buen post saludos desde paraguay 😀

  8. Que porque como xmpp.. Keen :)

  9. Frasko dice:

    Muy interesante el artículo, buen trabajo! 😉

  10. Tere dice:

    Excelente explicación!!! FELICIDADES!!!!!

  11. felixclase dice:

    Buena explicacion 😀

  12. Virgili dice:

    Fantástico!

  13. Anon dice:

    Bien el post, pero innecesaria la cantidad de proselitismo anti-Microsoft y pro-Google que haces en la introducción. No tengo nada en contra o a favor en particular de alguna de estas dos compañías, pero es cansado leer tus comentarios redundantes al respecto.

  14. Maxpowel dice:

    Hola Anon, he vuelto a leer el artículo y veo que tienes razón en parte. La única vez que menciono a Google (dejando claro que es simplemente una opinión) puede sobrar pero el resto creo que está totalmente justificado.
    El protocolo de MSN Messenger es cerrado y muchas veces cambiaba simplemente para hacer inútiles a los demás clientes (aunque sea temporalmente) y eso es claramente competencia desleal, algo muy muy feo.

    Aun así están en su derecho de hacerlo, pues es suyo y hacen con ello lo que quieren, pero yo también estoy en mi derecho a criticarlo. Estas críticas están totalmente justificadas y por eso no entiendo por qué me acusas de proselitsimo.

    Pero si algo hay que agradecer a Microsoft, es que con sus políticas tan draconianas en el fondo no hacen más que impulsar alternativas de software libre tan buenas como esta.

    Un saludo 😉

  15. Angel Alvarado dice:

    Hola buenas,
    Existe alguna manera de conectarme a Google Talk con JavaScript para implementarlo en mi website no utilizando el gadget de google para mensajeria.

    Saludos Max excelente documental

  16. Moisés dice:

    Buenas. Me ha encantado tu post, el problema que yo tengo es el siguiente, y no tengo manera de solucionarlo, a ver si me puedes ayudar: Tengo una web que en asp y javascript guarda un registro en una bd. Seguidamente, me gustarío enviar un mensaje a tres usuarios de openfire para advertirles del nuevo registro guardado, algo así como “Hay un nuevo registro”. El Openfire lo tengo funcionando muy bien y uso clientes spark. Alguna idea de como hacerlo. He ojeado documentación pero no me aclaro con como hacerlo, ni idea de como llamar al procedimiento. Gracias.

  17. Elit dice:

    Hola Maxpowel, espero sigas por aquí. Excelente articulo.
    Hay una duda que tengo sobre xmpp. Entendí que xmpp sería más bien el lenguaje de comunicación. Ahora bien, ¿se especifica de algún modo en la definición xmpp, cómo debe actuar el canal? Es decir, xmpp implica que debe haber una conexión persistente?
    Gracias

  18. fco dice:

    holaaa, muchas gracias por compartir esto, la verdad es que llevo ya un buen tiempo en el que de ves en cuando, termino en esta pagina! jaja, cada tantos meses llego aki, siempre, bueno, y te escribo, me podrias dar algun dato sobre instalar un servidor bosh, el que viene en las opciones de openfire no me funcionó y me gustaria instalar un servidor bosh para experimentar, tambien porque me sería util para mas de un proyecto!!

    bueno, eso, ojalá aun vez tu bog..

    pd: cuando digo que el bosh de openfire no me funciono, me refiero a que no pude hacer andar ningún chat por la web, y si que revise absolutamente todo, hasta el proxy en la configuracion de apache.

  1. 8 diciembre, 2010

    […] otros protocolos de mensajes como XMPP, SMTP o JMS para nombrar solo algunos y dejar por fuera mucho más. STOMP es un protocolo sencillo […]

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *