Bloxus en línea
El hermano pequeño de Blogalia, Bloxus, volvió hoy a la vida. En esta ocasión, y por desgracia, las pérdidas han sido mucho mayores que en Blogalia: La copia de seguridad disponible era bastante más antigua y Google no tenía tan bien cacheados todos los contenidos. El resultado es que sólo he podido recuperar un poco menos de la mitad de las historias (al menos, según la numeración).
Además de Google se han utilizado otras dos fuentes: Feedmanía (gracias José, por tu inestimable ayuda) y Bloglines (arañazo cortesía de JJ). Aquellos que no puedan entrar en sus cuentas, pueden enviar un correo a bloxus arroba gmail.com.
Reitero mis disculpas por todo lo ocurrido. ¶
Crónica de un pasmo (casi anunciado)
Hace justo una semana, me encontraba investigando las razones del reinicio del servidor que alojaba Blogalia. Una semana después, volvemos a estar en marcha en otro servicio de alojamientos, con algunas pérdidas de datos, especialmente de comentarios. Y es que cuando uno no transfiere las copias de fuera de la máquina... las imprudencias se pagan. Transcribo la historia que relaté en la lista de usuarios:
A finales del 2003 tuvimos un problema definitivo con John Companies. La base de datos se caía constantemente, hasta que al final se corrompió. "No problem, hay copias de seguridad". Falso: la empresa, dejó de hacerlos por alguna razón desconocida, y se disculparon. Tuvimos que recuperar dos o tres meses de artículos e historias a través de la caché de Google, Bloglines y otros. Sin embargo, los problemas de estabilidad de la máquina (un sistema Linux compartido), no se solventaron. Así que en febrero del 2004 nos mudamos a United Colo, Sagonet, con un servidor dedicado solo para nosotros. He de decir que hasta el viernes pasado estaba muy contento.
Pero el viernes pasado comenzamos a tener problemas con el servidor, se reiniciaba de forma periódica. Mientras investigaba si era una cuestión de software, abrí un ticket de soporte para ver qué ocurría y desconectaron la máquina antes de poder transferir los backups, pese a la indicación contraria. Se supone que sólo iba a estar fuera de combate "dos o tres horas"... Durante el fin de semana les envié tickets para conocer qué ocurría, por qué no estaba en marcha, y tras una llamada el domingo por la noche (esto está en Florida) me dijeron que estaba en reparación. Nuevo ticket para indicar que era vital recuperar la información. Llamé el lunes al mediodía (mañana allí) para insistir, y me aseguraron que
la máquina estaría en marcha de nuevo, con nuestros datos como disco
secundario. La máquina estuvo en marcha por la noche, pero como secundario
nos pusieron un disco con un Windows. Les envié un ticket en ese mismo
momento, ayer les envié un correo de queja, otros tickets y la única
respuesta ha sido "sí, lo estamos mirando". Tras presionar con contar la historia, a los 10 minutos el técnico que hizo la reparación dio completa información sobre el estado de la máquina, afirmando que él solo transfirió los discos de un lado a otro, sin hacer reinstalación. Pero el disco nuevo era un Linux pelado, de fecha 4 de abril. Su respuesta es que, quizás sí fue una reinstalación, y que, mirando en mi cuenta, no me la habían cobrado, pero que dada la situación, iban a dejarlo.
Visto lo visto, con la ayuda de JJ, el mismo lunes me puse a recuperar la caché de Google y a reconstruir la base de datos a partir del backup antiguo. Las historias estaban intactas, pero no los comentarios, documentos, categorías y plantillas. Finalmente, se han recuperado unos 70 mil comentarios.
Alguien decía que los usuarios de Blogalia deberían aprender la lección e irse a un servicio de pago. Espero sinceramente que no sea así, que este servicio es de pago, aunque yo asumo los costes. Sin embargo, sí es cierto que es imposible garantizar una disponibilidad 24/7/365. Por mi trabajo sé eso supone hacer una inversión muy grande en personal, hardware y servicios: discos redundantes, máquinas redundantes, conexiones redundantes, técnicos disponibles al minuto... hago lo que puedo en Blogalia, pero me es imposible garantizar tal cosa. Pero sí es de esperar que tomemos medidas para que, de ocurrir, sea por problemas técnicos y no por imprevisión humana.
Reitero lo comentado en la lista: Siento de veras todas las molestias, y me cabrea en especial no haber tenido los reflejos para copiar los backups antes de avisar de ningún problema al hosting. Asumo la (ir)responsabilidad por no haberlos sacado del sitio de forma periódica, y para mi no es consuelo decir que esto es una afición, que es gratis, ni similares: es el ABC de mi profesión. Lo que es cierto es que la carga de trabajo me ha hecho descuidar tareas importantes como estas y para paliar este hecho, en el nuevo alojamiento en Amen he dado acceso como administradores de la máquina a JJ y fernand0.
Agradezco mucho las muestras de apoyo. ¶
Normalización del DNS
Como se ha venido comentando en la lista, problemas adicionales con los servidores de nombre han boicoteado la (prevista) tranquila migración de servidor. La buena noticia es que parece que bastantes usuarios ya pueden acceder a www.blogalia.com y resto de bitácoras usando las direcciones habituales. ¶
Nuevo servidor
Desde hace un mes contamos con un nuevo servidor, debido a los problemas que ha generado el anterior alojamiento. Sin embargo, sólo se migró la base de datos, de tal forma que el interfaz de las bitácoras estaba en un alojamiento (el viejo) y la base de datos en otro (el nuevo). En la madrugada del sábado al domingo se cambió la configuración de los DNS del dominio blogalia.com, de tal forma que apuntaran al nuevo servidor y mostrar la aplicación desde ahí. Esto conlleva problemas, debido a que los servidores DNS de los proveedores deben refrescar su información. Esta es la razón por la cual en estos momentos es un poco difícil acceder a Blogalia. Como truco, se pueden utilizar las direcciones www.blogalia.blogdns.com y mibitacora.blogalia.blogdns.com
El nuevo servidor tiene más espacio, más memoria y más ancho de banda. Además, es un servidor dedicado, en lugar del compartido que teníamos antes (aunque era un sistema Linux completo, la máquina se compartía con varios linux). Esperamos la vuelta a la estabilidad en breve. ¶
Pesadilla después de Navidad
Esta semana hemos sufrido varios contratiempos que nos han tenido fuera de línea. Desde el domingo pasado, la base de datos sufría caídas. Este síntoma era conocido: era el aviso de que si no le poníamos remedio, acabaríamos como en el pasado verano, con la base de datos corrupta. Era previsible, porque es era la misma versión del programa.
Esta vez las copias de seguridad que hemos hecho estaban en perfecto estado. Hice un volcado con la base de datos, tal y como estaba el día 21, pero el error de la base de datos afectó a varias tablas (plantillas, documentos y categorías). Así que se utilizó la copia de seguridad del domingo día 18. Para no repetir los problemas, procedí a actualizar la base de datos (PostgreSQL 7.4) y el lenguaje de programación (PHP 4.3). La parte divertida vino cuando, todo listo, se puso en marcha el servicio: existían tantas peticiones simultáneas que el servidor se ahogaba. Era como subir la palanca en una casa con todos los electrodomésticos encendidos. Para aliviar la carga, la página frontal de Blogalia la pasé a un fichero estático, por lo que tardaba un tiempo en renovar.
Todo eso sucedió entre la tarde-noche del miércoles y la del jueves. El viernes por la mañana sufrimos otro problema no relacionado con el anterior: el dominio había caducado y la empresa registradora no lo había renovado. Llamada telefónica, y problema solucionado. Salvo que se tarda varias horas en que los servidores de dominio raíces de todo el mundo vuelvan a refrescar los datos. Para los más impacientes, puse en marcha una solución que fue utilizar un dominio dinámico: *.blogalia.blogdns.com.
Como no hay dos sin trés, mi correo personal estaba fuera de línea porque el alojamiento (otro diferente al que usamos en Blogalia) tenía apagado el servidor. Sin posibilidad de recibir o enviar mensajes.
Aunque siempre se me ocurren formas de empeorar la situación, espero que todo este cúmulo de situaciones no se vuelvan a repetir (especialmente con la nueva versión de la base de datos). ¶
Proyecto Eco: Más allá del RSS
Sam Ruby y otros expertos se han puesto en marcha el Proyecto Echo para estandarizar (de facto) los protocolos y formatos que usan las bitácoras para interaccionar entre sí. Tal y como explica Mark Pilgrim en su historia del RSS, el problema es que en estos momentos existen varios formatos diferentes para intercambiar titulares:
- RDF del W3C
- RSS 0.90 de Netscape
- RSS 0.91 de Userland
- RSS 1.0 de PURL
- RSS 2.0 de Userland
Y otro tanto ocurre con los protocolos para comunicarse remotamente con las bitácoras (lo que permite que w.bloggar pueda editar noticias en Blogalia):
- Blogger API de Blogger
- Blogger API 2.0 de Blogger
- Extensiones al Blogger API de MovableType
- metaWeblog API de Userland
- Comment API
Por tanto, Ruby y otros están trabajando para simplificar todos estos formatos y protocolos. En estos momentos ya tiene el apoyo de los pesos pesados del software para bitácoras, Blogger, LiveJournal y MovableType.
Por supuesto, Blogalia será EchoEnabled. ¶
Categorías en metaWeblog API
Bueno, pues desde ayer el interfaz remoto que hace posible que w.bloggar funcione soporta categorías, de tal forma que al editar historias se puedan elegir. ¶
Actualización de la base de datos
He instalado la versión PostgreSQL 7.3.3. Ha mejorado un poquitín el aumento de rendimiento.
PD: Casualmente, hablando con David Sifry acerca del problema (usan MySQL en Technorati), me sugirió utilizar la orden explain para averiguar dónde se encontraba el cuello de botella en las consultas que realizan a la base de datos. Ahora, en lugar de utilizar sólo una para obtener el top de historias más comentadas, se utilizan varias consultas. Y ahora va mucho más rápido. ¶
Estabilidad
En las últimas semanas hemos sufrido muchos problemas de estabilidad. Finalmente, una búsqueda en Google ha solventado el problema.
Por cierto, que la caché estática está desactivada, porque daba más problemas que soluciones. Hasta nuevo aviso (la idea es buena).
¶
Cacheo de página principal
Si eres lector habitual de Blogalia, quizás habrás podido comprobar que la página principal de Blogalia estaba tardando algunos segundos en generarse. Las estadísticas sobrecargan un poco la base de datos. Gabriel Rodríguez Alberich (Chewie) me envío un script para solventar el problema.
Ahora, cada minuto dicho script vuelca la página principal a un fichero, a modo de caché, que es el que se sirve. Por tanto, a partir de estos momentos la página principal tardará un minuto en refrescarse, así que no desesperes si no ves tu historia al instante ;) ¶
Notificaciones a bitácoras.net
He añadido un par de líneas de código para que las nuevas historias de Blogalia aparezcan en el listado de actualizaciones de bitacoras.net.
PD: Esta historia sirve de prueba. ¶
Blogatex: Editor de Blogalia para Linux
Buena parte de los usuarios activos de Blogalia usan w.bloggar para editar sus notas. Para Linux no hay muchos programas similares (Exaro, Blognix y están abandonados). Para remediar la situación, Gabriel Rodríguez (Chewie) y yo hemos programado una utilidad que se puede descargar en el repositorio de proyectos libres de Blogalia en SourceForge.
Para usar esta herramienta, que de momento hemos llamado Blogatex, hay que instalar Python 2.2, Qt 3.0, PyQt 3.5 y sip 3.5. Si alguien se anima, nos gustaría empaquetarlo en RPM y DEB.
De momento es una versión preliminar que solo funciona para Blogalia. Hace uso del MetaWeblog API y Blogger API, y en un futuro publicaremos una versión sin extensiones específicas (y quizás otra versión para las extensiones de Movable Type. Y ojo: esto es software en versión alfa ;)
Comentarios, sugerencias y demás, son bienvenidos. ¶
Estándares blogueros "patas arriba"
Ayer comentaba las propuestas que se están realizando para unificar el API de acceso remoto a las bitácoras. Hoy me encuentro con la propuesta de unificación y simplificación del formato de intercambio de titulares. Los chicos de SixApart proponen un RSS para weblogs. En la bitácora de Sam Ruby hay dos hilos de comentarios sobre este asunto. ¶
Un vistazo a los APIs para bitácoras
Diego realiza un repaso a los APIs para bitácoras (conjuntos de funciones) que permiten a los usuarios utilizar programas como w.bloggar para actualizar sus bitácoras.
Dejo el enlace por aquí a modo de recordatorio para verlo con más calma, sobre todo los comentarios, donde hay mucha chicha (p.e. veo que ya hay propuesto unas funciones para acceder remotamente a los comentarios).
PD: Hablando de bitácoras, ¿cómo debería ser el software para bitácoras definitivo? (en Blogalia cumplimos la mayor parte de los requirimientos, salvo una licencia libre para el código). ¶
Número de historias, configurable
A partir de ahora, cada bitácora se puede configurar para mostrar un número determinado de historias en portada, que puede ir desde 1 a 30. La razón de esta novedad es que la página del Blogómetro mostraba demasiado contenido por historia (ranking + enlaces).
Para cambiar el número de historias a mostrar, debes ir a la página de edición de tu bitácora, y luego al menú Configuración > Historias. Ahí aparecerá un formulario con el número de historias actual.
Otro día, más. ¶
Nuevo estilo: Dogma
Acabo de poner un nuevo estilo predefinido, basado en el de rivendel.org y ruben.abad. Es estilo es minimalista, muy sencillo, pero efectivo. El nombre del estilo, Dogma, proviene de la espeficicación Dogma 2003 propuesta por David de Ugarte.
Que lo aprovechen ;) ¶
Cambio de servidores DNS + Proxys/Apache
En los próximos días migraremos desde los actuales servidores DNS a los de nuestro ISP, John Companies. Este será el último paso para poder apagar (por fín) el viejo servidor de Blogalia. No espero que afecte en nada al servicio, dado que la IP de Blogalia es exactamente igual, tanto para los servidores DNS actuales como para los nuevos.
Por otra parte, ayer configuré el servidor web para que redireccionara cualquier petición a *.blogalia.dnsalias.com a *.blogalia.com.
Y hablando de configuraciones del servidor, para los que sepan algo de Apache, estas son las líneas que usamos para que el proxy-caché de Telefónica no cachee nuestras páginas (las que terminan internamente en .xml o .php). Sí se permite que cacheen las imágenes, durante un día.
# Configuración por proxy-caché de Telefónica
ExpiresActive On
ExpiresByType image/gif A86400
ExpiresByType image/png A86400
ExpiresByType image/jpg A86400
ExpiresDefault "modification plus 1 day"
<Files ^*\.(php|xml)>
Header append Cache-Control "no-cache"
</Files>
Pedro Jorge me había comentado hace unos días que había notado un gran descenso de visitas, atendiendo a sus últimas estadísticas. Lo mismo podemos decir de Blogalia. Nuestro caso es particularmente interesante, porque, como hemos visto, no se deben cachear las páginas, así que no habría que notar ningun descenso. ¿El problema? La IP del proxy-caché sustituye a la del ordenador original. Veamos un ejemplo:
Si yo accediera a www.blogalia.com, con la configuración de serie del Apache en Linux y sin proxy-caché de por medio, se registraría la siguiente línea:
217.126.206.203 - - [04/Feb/2003:06:20:21 -0800] "GET / HTTP/1.1" 200 31458 "-" "Mozilla/5.0 (compatible; Konqueror/3.1; Linux)"
Sin embargo, lo que se regstra es:
80.58.20.42 - - [04/Feb/2003:06:20:21 -0800] "GET / HTTP/1.1" 200 31458 "-" "Mozilla/5.0 (compatible; Konqueror/3.1; Linux)"
Para solventar este problema, he modificado la configuración del Apache (httpd.conf) para registrar la IP del cliente, en caso de que se use un proxy-caché.
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %{Client-ip}i" com
bined
Y ahora aparece:
80.58.20.42 - - [04/Feb/2003:06:20:21 -0800] "GET / HTTP/1.1" 200 31458 "-" "Mozilla/5.0 (compatible; Konqueror/3.1; Linux)" 217.126.206.203
El problema al que nos enfrentamos es que el webalizer no está configurado para tener en cuenta esa IP final. Y no podemos usar siempre esa IP final ({%client-ip}) porque no siempre se accede a Blogalia a través de proxy-caché y por tanto, se registra un guión (-) en lugar de una IP:
212.53.63.11 - - [04/Feb/2003:06:24:48 -0800] "GET / HTTP/1.0" 200 58506 "http://javarm.blogalia.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" -
Así que el problema de las estadísticas todavía lo tengo por solventar. ¶
Pequeños arreglos
Hoy/ayer he realizado pequeños ajustes en la configuración y en la programación.
1. Las reglas de mod_rewrite para las URLs no eran del todo correctas para el dominio www.blogalia.com, y hacía que la página de comentarios se mostrara sin diseño.
2. En la página de listado de comentarios, en la edición de historias, he corregido los enlaces, porque seguían utilizando el esquema anterior.
3. En la página de listado de los 100 últimos comentarios, he añadido el enlace al ancla del comentario al que se está haciendo referencia. Antes al hacer clic íbamos a la página de comentarios de la historia; ahora, además, situamos la ventana del navegador en el comentario en concreto.
Así son las cosas y así se las hemos contado. ¶
¿Problemas de acceso? ¿Dolores de cabeza?
¿Tienes problemas para acceder a Blogalia? ¿Tienes que cambiar de conexión, ir a un cibercafé o a la universidad para leer las bitácoras? ¿Se te está poniendo la cara azul de no comentar durante varios días alguna de las historias blogalitas? Bueno, pues aquí presentamos la Guía del Jonki Blogatil Jodido por el Proxy-Caché de Telefónica:
1. Los problemas que hemos sufrido tienen su origen en el cambio de IP de Blogalia, porque nos mudamos a un nuevo servidor, que es más rápido, más bonito y lava más blanco.
2. Como consecuencia de ello, los proxys-caché de Telefónica se han hecho la picha un lío, y (por lo que he podido averiguar y poniendo mucho de Holmes de mi parte) no resolvían bien la nueva dirección.
3. ¿Cómo acceder a Blogalia si tengo problemas? La primera solución es usar el dominio blogalia.dnsalias.com. Por ejemplo, si quieres visitar la bitácora de El Pez escribes: javarm.blogalia.dnsalias.com
4. La segunda solución, si esa no te va, es usar el puerto 88: http://javarm.blogalia.com:88/
5. La tercera solución es mudarse a un país decente en el que la gente normal no ladre.
6. Sugerencias en los comentarios a esta historia. Insultos a esta dirección de correo. ¶
Más notas sobre la migración
Esta tarde he tenido algunos problemas con las reglas de mod_rewrite, así que durante una horilla el web ha estado funcionando a ratos sí, a ratos no, y a ratos lo de funcionar era un eufemismo.
Tal y como comento en Barrapunto, Telefónica ha dispuesto unos documentos donde explican el funcionamiento de sus proxys-caché. He dispuesto una cabecera que se envía en nuestras páginas para que sus proxys no cacheen nuestras páginas (Cache-Control: no-cache). Esperemos que nos haga caso. ¶
|
|
|
Noticias sobre el desarrollo de Blogalia
< | Diciembre 2024 | |
Lu |
Ma |
Mi |
Ju |
Vi |
Sa |
Do |
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
|
|
|
|
|
Recursos
Proyectos
Otras bitácoras
|
|
|