-  
 
Preguntas frecuentes (F.A.Q.)
TodoRed
 
 
TodoRed le proporciona el mejor soporte para el hospedaje de sus páginas web. Si la información que necesita no la encuentra en este área de soporte, por favor, envíenos un email a preguntas@todored.com

Definiciones de la página de estadísticas

  Interpretación de los resultados de HTTP-ANALYZE 2.0


¿Qué es un servidor web?
Un servidor web es un programa ejecutándose en una máquina en red, esperando conexiones externas para servir ciertos documentos a petición de un navegador.

Para comunicarse, el servidor y el navegador utilizan un método de comunicación asíncrono llamado HTTP (protocolo de transferencia hipertexto). Funciona de la manera siguiente:

  1. El usuario arranca el navegador y escribe una URL.
  2. El navegador se conecta al host y solicita un documento.
  3. El servidor web procesa la petición y devuelve una respuesta:
    1. Si el documento existe, el servidor web lo envía,
    2. si el documento no existe o si el acceso no está permitido, el servidor web devuelve un mensaje de error.

El documento enviado como respuesta a esta petición puede contener objetos inline. Los objetos inline son simplemente URLs apuntando a otros recursos, como un documento, una imagen, un applet, un stream video/audio o cualquier otro objeto HTML direccionable.

El navegador entonces pide todos los objetos inline de la página actual al servidor según los pasos 2 y 3 de arriba antes de que se pueda ver el contenido de la página.
Este método de comunicación se llama asíncrono porque el navegador envía muchas peticiones de documentos inline de una vez (sin esperar una respuesta del servidor antes de enviar la siguiente petición) utilizando diferentes canales de comunicación:

Ya que las peticiones del navegador son frecuentemente manejadas por diferentes procesos del servidor o por diferentes hilos de un proceso del servidor, no hay ninguna relación entre las entradas del fichero log generadas por las respuestas del servidor a una petición de un documento y sus objetos inline.
Por ejemplo, el orden en que el servidor loguea las transmisiones con éxito del documento en sí y las imágenes inline que contiene no es predecible y depende del tipo de documentos, objetos, velocidad del servidor, carga del sistema y de la red y   de muchos otros parámetros.


¿Qué se loguea?
Todas y cada una de las respuestas del servidor, tanto si tienen éxito, error, o incluso timeout (ejp. sin respuesta) - se loguean en el fichero log del servidor. Ya que el servidor es "impactado" (hit) por una petición, la respuesta se denomina "Hit". En otras palabras, el numero total de hits debe ser igual al número total de líneas del fichero log menos el número de líneas corruptas o vacías. Una entrada típica en formato común en el fichero log tiene la siguiente forma:

hostname - - [01/Feb/1998:10:10:00 +0100] "

GET /index.html HTTP/1.0" 200 4839

El campo hostname contiene el nombre de dominio cualificado completo ,full qualified domain name (FQDN), del sitio que accede a su servidor  (vea »Casos especiales« abajo). Los dos campos siguientes habitualmente contienen un menos ('-') para indicar que están vacíos. La fecha está rodeadada por paréntesis rectangulares ('[' y ']'). El siguiente campo contiene la petición. Contiene el método de petición (GET por ejemplo), el nombre del documento pedido (URI), y la especificación del protocolo (HTTP/1.0). El siguiente campo contiene el código de respuesta del servidor (200 es un »OK«, mientras que 404 significa »Documento no encontrado«, por ejemplo). El último campo contiene el tamaño del documento (algunos servidores escriben el número de bytes transferidos actualmente, mientras que otros loguean el tamaño del documento, lo que les hace diferenciarse si la transferencia es interrumpida antes de que el documento se haya transmitido completamente.

Existen otros dos tipos de formatos de fichero log, los formatos combinado y extendido. Estos formatos añaden el user-agent (tipo de navegador) y el referrer URL (la página que contiene el enlace al documento pedido si la petición ha sido generada siguiendo un hipervínculo) a la entrada en el fichero log. Estos dos formatos añaden los dos siguientes campos al formato de fichero log común, Common Logfile Format (CLF) de una o dos formas:


CLF Mozilla/2.0 (X11; IRIX 6.3; IP22) 

http://foo/bar.html

CLF "http://foo/bar.html" 

"Mozilla/2.0 (X11; IRIX 6.3; IP22)"

Tenga en cuenta que en la segunda forma, el user-agent y el referrer URL están rodeados por dobles comillas, lo que provoca ambigüedades, como el caso de referrer URLs erróneos, el cual contiene dobles comillas. En consecuencia es preferible la primera forma cuando sea posible.

Las entradas mostradas arriba son la única información que el servidor graba en el fichero log. Hay mucha más información que se transfiere del navegador al servidor, pero aunque esta información adicional está disponible mediante scripts CGI instalados en su servidor, no se graba en el fichero log. En consecuencia, http-analyze sólo le puede ofrecer un sumario de la de la información del fichero log.


Casos especiales
Caché del navegador:

Tan pronto como una página ha sido grabada en la caché de disco del navegador, éste puede enviar peticiones condicionales de documentos u objetos inline. Esta petición condicional pide al servidor que envíe el objeto o documento sólo si ha sido modificado desde la última vez que se pidió (si la página está todavía en la caché del navegador). De esta forma, el tráfico se reduce algo, ya que los documentos se transferirán sólo si han tenido cambios recientes. Si le llega una petición condicional, el servidor responderá con un código 304 (No Modificada) para indicar que el documento no ha cambiado o con un código 200 (OK) para indicar que ha sido modificada entretanto. Ya que los navegadores pueden ser configurados para enviar peticiones condicionales una vez por sesión (normalmente es así por defecto) y después utilizar la copia de la caché, usted puede que no vea el código 304 si el usuario visita el sitio de nuevo en la misma sesión. Las peticiones condicionales sólo se enviarán si el usuario termina la sesión del navegador y posteriormente lo reinicia.

Caché en un servidor proxy:
Lás organizaciones con un gran número de usuarios - como grandes compañías, universidades, proveedores en línea - frecuentemente usan servidores proxy por dos razones principalmente:

  1. Frecuentemente, estas organizaciones tienen un firewall para proteger su red interna de intrusos. Esto significa que su red está separada lógicamente de Internet y que ellos tienen que utilizar un servidor proxy, el cual les sirve para comunicarse con el interior y el exterior de su red de área local.
  2. Para reducir la carga de la red, el servidor proxy actúa como una máquina de copia local: Tan pronto como una página es cargada en el navegador mediante el servidor proxy, éste guarda una copia de la página en su caché de la misma forma que lo hace un navegador en el escenario expuesto arriba. De esta forma, los documentos pedidos frecuentemente en la red de área local necesitan ser transferidos al proxy una sola vez, el cual responderá a las futuras peticiones de la misma página desde su caché local en vez de conectarse al servidor web de donde procede el documento original.

Con ambas formas de caché es técnicamente imposible contar los visitantes o rastrear las páginas que han visitado en su sitio web. Todo lo que podrá ver en el fichero log de su servidor serán unos pocos hits iniciales desde el proxy o el navegador y probablemente algunos códigos 304 de respuesta a peticiones condicionales enviadas por el proxy o el navegador, dependiendo de las opciones de configuración de éstos.


Definición de términos
El informe de estadísticas contiene entre otra, la siguiente información:
  • El número de hits, 304, ficheros, páginas vistas, sesiones, datos enviados (en KB).
  • La cantidad de datos pedidos, transferidos y guardados por la caché (en KB).
  • El número de URLs, sitios y sesiones por mes.
  • El número de códigos de respuesta distintos de 200 (OK).
  • La media de hits por día de la semana y durante la última semana.
  • El máximo y media de hits por día y por hora.
  • El número de hits, ficheros, 304, sitios y datos enviados por día.
  • Los 5 días, 24 horas, 5 minutos y 5 segundos máximos del período del sumario.
  • Las 30 URLs más comúnmente accedidas (hits, 304, datos enviados).
  • Las 10 URLs menos frecuentemente accedidas (hits, 304, datos enviados)
  • Los 30 dominios que más frecuentemente acceden a su servidor.
  • Los 30 tipos de navegadores máximos.
  • Los 30 hosts referrers máximos.
  • La lista en sumario/detallada de todos los ficheros pedidos.
  • La lista en sumario/detallada de todos los sitios por dominio y dominio inverso.
  • La lista en sumario/detallada de todos los tipos de navegador.
  • La lista en sumario/detallada de todos los URLs referrer.
  • La siguiente tabla resume el significado de todos los términos que no se autoexplican en el informe de estadísticas:

    Término Significado
    Hits Un hit es cualquier respuesta del servidor a una petición enviada desde un navegador. Esto incluye cualquier respuesta, no sólo ficheros de texto o documentos. Si, por ejemplo, una página HTML tiene dos imágenes incrustadas, el servidor generará tres hits cuando se pida la página: un hit por la página HTML y dos por las dos imágenes inline.
    Files Si el usuario pide un documento y el servidor devuelve con éxito un fichero a esta petición, la respuesta se contará como un código 200 (OK). Cualquier respuesta de este tipo es contada como un fichero (file). De nuevo, "file" aquí significa cualquier tipo de fichero.
    Code 304 Una respuesta código 304 (No Modificado) es generada por el servidor si un documento no ha sido actualizado desde la última vez que el usuario lo pidió y como consecuencia no hay necesidad de enviar los ficheros de este documento. Esto sucede si el navegador (o un servidor proxy con caché entre el navegador y su servidor web) todavía tiene una copia no caducada de la página en su almacén local (caché) y como consecuencia puede visualizar la página sin necesidad de pedir el contenido actual. Esta técnica se utiliza para reducir el tráfico en la red, pero produce una imprecisión en los informes estadísticos en cuanto a número de visitantes, debido a que el navegador o el usually normalmente sólo envían una petición condicional por sesión del usuario si todavía alberga una copia actualizada del fichero. Sin embargo, el ratio entre files y 304s refleja la eficiencia global de los mecanismos de caché para, al menos, aquellos hits que llegaron al servidor.
    Pageviews Las vistas de páginas son ficheros que, o tienen el sufijo de fichero de texto (.html, .text) o son índices de directorio. Este número permite estimar el número de documentos "reales" transmitidos por su servidor. Si se define correctamente, analyzer cuenta los ficheros de texto (documentos) como pageviews. Estas pageviews no incluyen imágenes, scripts CGI, applets de Java o cualquier otro objeto HTML excepto todos los ficheros que acaban con uno de los sufijos predefinidos para las vistas de páginas, como .html o .text.
    Otras respuestas Existen muchas más respuestas aparte del Código 200 (OK) y el Código 304 (No Modificado), especialmente en la especificación del protocolo HTTP 1.1. Por ejemplo, el servidor puede generar un Código 302 (Redirigido) si la página se ha trasladado, un Código 401 (Petición No Autorizada) si el acceso al documento es denegado o un Código 404 (No Encontrado) si la página solicitada no existe en el servidor.
    KBytes transferred Es la cantidad de datos transferida durante el período del informe por el servidor. Tenga en cuenta que algunos servidores escriben el tamaño del documento en vez del número actual de bytes transferidos. Mientras que en la mayoría de los casos es lo mismo, si un usuario interrumpe la transmisión presionando el botón de parar del navegador antes de que la página haya sido recibida completamente habrá un desfase. Algunos servidores (por ejemplo los servidores web de Netscape) no escriben la cantidad de datos transferidos, escriben la cantidad que se hubiera transferido si el usuario hubiera cargado completamente la página.
    KBytes requested Es la cantidad de datos pedidos durante el período del informe. Http-analyze computa este número sumando los valores KBytes transferred y KBytes saved by cache (vea más abajo).
    KBytes saved by cache Es la cantidad de datos guardados por varios mecanismos de caché como servidores proxy o navegadores. Este valor se computa multiplicando el número de códigos 304 (No Modificado) por el tamaño del correspondiente fichero. Nota: Ya que http-analyze puede determinar el tamaño de un fichero sólo si el fichero ha sido pedido al menos una vez en el período del sumario, los valores de KBytes saved by cache y KBytes requested son simples aproximaciones a los valores reales.
    Unique URLs Unique URLs es el número de todas las URLs válidas y diferentes en el período del sumario. Esto muestra el número de los ficheros diferentes pedidos al menos una vez en el período del sumario.
    Unique sites Es la suma de todos los hosts únicos que han accedido al servidor durante el mes actual. Esto significa que si un host accede a su servidor muy frecuentemente, se contará sólo una vez en el mes entero. Sólo se lista la suma de hosts únicos por mes en el informe estadístico.
    Sessions Es similar a unique sites, es la suma de todos los hosts únicos que han accedido al servidor durante un día, este período de tiempo puede ser cambiado con la opción -u o la directiva Session en el fichero de configuración. Por ejemplo, si el período son dos horas, todos los accesos desde un determinado host en menos de dos horas después del primer acceso son agrupados en una sesión. Todos los siguientes accesos después de las dos horas son contados en una nueva sesión. De esta forma usted puede estimar el número de sesiones que han empezado en diferentes sitios para acceder a su servidor.

     


    Nuestro manual de apoyo en línea se actualiza mensualmente para reflejar los nuevos procedimientos y cambios en el servicio.

     
     
    - © 2000-2001 TodoRed