| |
| Preguntas
frecuentes (F.A.Q.) |
|
|
|
|
|
| TodoRed le proporciona el mejor soporte para el
hospedaje de sus páginas web. Si la información que necesita no la encuentra en este
área de soporte, por favor, envíenos un email a preguntas@todored.com |
Definiciones de la
página de estadísticas Interpretación de los resultados de HTTP-ANALYZE 2.0
|
¿Qué es un servidor web?
Un servidor web es un programa ejecutándose en una máquina en red, esperando conexiones
externas para servir ciertos documentos a petición de un navegador.Para comunicarse, el servidor y el navegador utilizan un método
de comunicación asíncrono llamado HTTP (protocolo de transferencia hipertexto).
Funciona de la manera siguiente:
- El usuario arranca el navegador y escribe una URL.
- El navegador se conecta al host y solicita un
documento.
- El servidor web procesa la petición y devuelve una
respuesta:
- Si el documento existe, el servidor web lo envía,
- si el documento no existe o si el acceso no está
permitido, el servidor web devuelve un mensaje de error.
El documento enviado como respuesta a esta petición
puede contener objetos inline. Los objetos inline son simplemente URLs apuntando a
otros recursos, como un documento, una imagen, un applet, un stream video/audio o
cualquier otro objeto HTML direccionable.
El navegador entonces pide todos los
objetos inline de la página actual al servidor según los pasos 2 y 3 de arriba antes de
que se pueda ver el contenido de la página.
Este método de comunicación se llama asíncrono porque el navegador
envía muchas peticiones de documentos inline de una vez (sin esperar una respuesta del
servidor antes de enviar la siguiente petición) utilizando diferentes canales de
comunicación:
Ya que las peticiones del navegador son
frecuentemente manejadas por diferentes procesos del servidor o por diferentes hilos de un
proceso del servidor, no hay ninguna relación entre las entradas del fichero log
generadas por las respuestas del servidor a una petición de un documento y sus objetos
inline.
Por ejemplo, el orden en que el servidor loguea las transmisiones con
éxito del documento en sí y las imágenes inline que contiene no es predecible y depende
del tipo de documentos, objetos, velocidad del servidor, carga del sistema y de la red y
de muchos otros parámetros.
|
¿Qué se loguea?
Todas y cada una de las respuestas del servidor, tanto si tienen éxito, error, o incluso timeout
(ejp. sin respuesta) - se loguean en el fichero log del servidor. Ya que el servidor es
"impactado" (hit) por una petición, la respuesta se denomina "Hit".
En otras palabras, el numero total de hits debe ser igual al número total de líneas del
fichero log menos el número de líneas corruptas o vacías. Una entrada típica en
formato común en el fichero log tiene la siguiente forma:
hostname - - [01/Feb/1998:10:10:00 +0100] "
GET /index.html HTTP/1.0" 200 4839
El campo hostname contiene el nombre de
dominio cualificado completo ,full qualified domain name (FQDN), del sitio que accede a su
servidor (vea »Casos especiales« abajo). Los dos campos siguientes habitualmente
contienen un menos ('-') para indicar que están vacíos. La fecha está
rodeadada por paréntesis rectangulares ('[' y ']'). El siguiente campo
contiene la petición. Contiene el método de petición (GET por ejemplo), el
nombre del documento pedido (URI), y la especificación del protocolo (HTTP/1.0).
El siguiente campo contiene el código de respuesta del servidor (200 es un
»OK«, mientras que 404 significa »Documento no encontrado«, por ejemplo). El
último campo contiene el tamaño del documento (algunos servidores escriben el número de
bytes transferidos actualmente, mientras que otros loguean el tamaño del documento, lo
que les hace diferenciarse si la transferencia es interrumpida antes de que el documento
se haya transmitido completamente.
Existen otros dos tipos de formatos de fichero log, los
formatos combinado y extendido. Estos formatos añaden el user-agent
(tipo de navegador) y el referrer URL (la página que contiene el enlace al
documento pedido si la petición ha sido generada siguiendo un hipervínculo) a la entrada
en el fichero log. Estos dos formatos añaden los dos siguientes campos al formato de
fichero log común, Common Logfile Format (CLF) de una o dos formas:
CLF Mozilla/2.0 (X11; IRIX 6.3; IP22)
http://foo/bar.html
CLF "http://foo/bar.html"
"Mozilla/2.0 (X11; IRIX 6.3; IP22)"
Tenga en cuenta que en la segunda forma, el user-agent
y el referrer URL están rodeados por dobles comillas, lo que provoca
ambigüedades, como el caso de referrer URLs erróneos, el cual contiene dobles comillas.
En consecuencia es preferible la primera forma cuando sea posible.
Las entradas mostradas arriba son la única información
que el servidor graba en el fichero log. Hay mucha más información que se transfiere del
navegador al servidor, pero aunque esta información adicional está disponible mediante
scripts CGI instalados en su servidor, no se graba en el fichero log. En consecuencia, http-analyze
sólo le puede ofrecer un sumario de la de la información del fichero log.
|
Casos especiales
Caché del navegador:
Tan pronto como una página ha sido grabada en la caché de disco del
navegador, éste puede enviar peticiones condicionales de documentos u objetos inline.
Esta petición condicional pide al servidor que envíe el objeto o documento sólo si ha
sido modificado desde la última vez que se pidió (si la página está todavía en la
caché del navegador). De esta forma, el tráfico se reduce algo, ya que los documentos se
transferirán sólo si han tenido cambios recientes. Si le llega una petición
condicional, el servidor responderá con un código 304 (No Modificada) para
indicar que el documento no ha cambiado o con un código 200 (OK) para indicar que
ha sido modificada entretanto. Ya que los navegadores pueden ser configurados para enviar
peticiones condicionales una vez por sesión (normalmente es así por defecto) y después
utilizar la copia de la caché, usted puede que no vea el código 304 si el usuario visita
el sitio de nuevo en la misma sesión. Las peticiones condicionales sólo se enviarán si
el usuario termina la sesión del navegador y posteriormente lo reinicia.Caché en un servidor proxy:
Lás organizaciones con un gran número de usuarios - como grandes
compañías, universidades, proveedores en línea - frecuentemente usan servidores proxy
por dos razones principalmente:
- Frecuentemente, estas organizaciones tienen un firewall
para proteger su red interna de intrusos. Esto significa que su red está separada
lógicamente de Internet y que ellos tienen que utilizar un servidor proxy, el cual les
sirve para comunicarse con el interior y el exterior de su red de área local.
- Para reducir la carga de la red, el servidor proxy
actúa como una máquina de copia local: Tan pronto como una página es cargada en el
navegador mediante el servidor proxy, éste guarda una copia de la página en su caché de
la misma forma que lo hace un navegador en el escenario expuesto arriba. De esta forma,
los documentos pedidos frecuentemente en la red de área local necesitan ser transferidos
al proxy una sola vez, el cual responderá a las futuras peticiones de la misma página
desde su caché local en vez de conectarse al servidor web de donde procede el documento
original.
Con ambas formas de caché es técnicamente imposible
contar los visitantes o rastrear las páginas que han visitado en su sitio web. Todo lo
que podrá ver en el fichero log de su servidor serán unos pocos hits iniciales desde el
proxy o el navegador y probablemente algunos códigos 304 de respuesta a peticiones
condicionales enviadas por el proxy o el navegador, dependiendo de las opciones de
configuración de éstos.
|
Definición de términos
El informe de estadísticas contiene entre otra, la siguiente información:
El número de hits, 304, ficheros, páginas vistas,
sesiones, datos enviados (en KB).
La cantidad de datos pedidos, transferidos y guardados por
la caché (en KB).
El número de URLs, sitios y sesiones por mes.
El número de códigos de respuesta distintos de 200 (OK).
La media de hits por día de la semana y durante la
última semana.
El máximo y media de hits por día y por hora.
El número de hits, ficheros, 304, sitios y datos enviados
por día.
Los 5 días, 24 horas, 5 minutos y 5 segundos máximos del
período del sumario.
Las 30 URLs más comúnmente accedidas (hits, 304,
datos enviados).
Las 10 URLs menos frecuentemente accedidas (hits, 304,
datos enviados)
Los 30 dominios que más frecuentemente acceden a su
servidor.
Los 30 tipos de navegadores máximos.
Los 30 hosts
referrers máximos.
La lista en sumario/detallada de todos los ficheros
pedidos.
La lista en sumario/detallada de todos los sitios por
dominio y dominio inverso.
La lista en sumario/detallada de todos los tipos de
navegador.
La lista en sumario/detallada de todos los URLs referrer.
La siguiente tabla resume el significado de todos los
términos que no se autoexplican en el informe de estadísticas:
| Término |
Significado |
| Hits |
Un hit es cualquier respuesta del servidor a una
petición enviada desde un navegador. Esto incluye cualquier respuesta, no sólo ficheros
de texto o documentos. Si, por ejemplo, una página HTML tiene dos imágenes incrustadas,
el servidor generará tres hits cuando se pida la página: un hit por la página HTML y
dos por las dos imágenes inline. |
| Files |
Si el usuario pide un documento y el servidor devuelve
con éxito un fichero a esta petición, la respuesta se contará como un código 200
(OK). Cualquier respuesta de este tipo es contada como un fichero (file). De nuevo,
"file" aquí significa cualquier tipo de fichero. |
| Code 304 |
Una respuesta código 304 (No Modificado) es
generada por el servidor si un documento no ha sido actualizado desde la última vez que
el usuario lo pidió y como consecuencia no hay necesidad de enviar los ficheros de este
documento. Esto sucede si el navegador (o un servidor proxy con caché entre el navegador
y su servidor web) todavía tiene una copia no caducada de la página en su almacén local
(caché) y como consecuencia puede visualizar la página sin necesidad de pedir el
contenido actual. Esta técnica se utiliza para reducir el tráfico en la red, pero
produce una imprecisión en los informes estadísticos en cuanto a número de visitantes,
debido a que el navegador o el usually normalmente sólo envían una petición condicional
por sesión del usuario si todavía alberga una copia actualizada del fichero. Sin
embargo, el ratio entre files y 304s refleja la eficiencia global de los
mecanismos de caché para, al menos, aquellos hits que llegaron al servidor. |
| Pageviews |
Las vistas de páginas son ficheros que, o tienen el
sufijo de fichero de texto (.html, .text) o son índices de directorio. Este
número permite estimar el número de documentos "reales" transmitidos por su
servidor. Si se define correctamente, analyzer cuenta los ficheros de texto (documentos)
como pageviews. Estas pageviews no incluyen imágenes, scripts CGI, applets de Java o
cualquier otro objeto HTML excepto todos los ficheros que acaban con uno de los sufijos
predefinidos para las vistas de páginas, como .html o .text. |
| Otras respuestas |
Existen muchas más respuestas aparte del Código 200
(OK) y el Código 304 (No Modificado), especialmente en la especificación del
protocolo HTTP 1.1. Por ejemplo, el servidor puede generar un Código 302 (Redirigido)
si la página se ha trasladado, un Código 401 (Petición No Autorizada) si el
acceso al documento es denegado o un Código 404 (No Encontrado) si la página
solicitada no existe en el servidor. |
| KBytes transferred |
Es la cantidad de datos transferida durante el período
del informe por el servidor. Tenga en cuenta que algunos servidores escriben el tamaño
del documento en vez del número actual de bytes transferidos. Mientras que en la mayoría
de los casos es lo mismo, si un usuario interrumpe la transmisión presionando el botón
de parar del navegador antes de que la página haya sido recibida completamente habrá un
desfase. Algunos servidores (por ejemplo los servidores web de Netscape) no escriben la
cantidad de datos transferidos, escriben la cantidad que se hubiera transferido si el
usuario hubiera cargado completamente la página. |
| KBytes requested |
Es la cantidad de datos pedidos durante el período del
informe. Http-analyze computa este número sumando los valores KBytes
transferred y KBytes saved by cache (vea más abajo). |
| KBytes saved by cache |
Es la cantidad de datos guardados por varios mecanismos
de caché como servidores proxy o navegadores. Este valor se computa multiplicando el
número de códigos 304 (No Modificado) por el tamaño del correspondiente fichero.
Nota: Ya que http-analyze puede determinar el tamaño de un fichero sólo si el
fichero ha sido pedido al menos una vez en el período del sumario, los valores de KBytes
saved by cache y KBytes requested son simples aproximaciones a los valores
reales. |
| Unique URLs |
Unique URLs es el número de todas las URLs
válidas y diferentes en el período del sumario. Esto muestra el número de los ficheros
diferentes pedidos al menos una vez en el período del sumario. |
| Unique sites |
Es la suma de todos los hosts únicos que han accedido
al servidor durante el mes actual. Esto significa que si un host accede a su servidor muy
frecuentemente, se contará sólo una vez en el mes entero. Sólo se lista la suma de
hosts únicos por mes en el informe estadístico. |
| Sessions |
Es similar a unique sites, es la suma de todos
los hosts únicos que han accedido al servidor durante un día, este período de tiempo
puede ser cambiado con la opción -u o la directiva Session en el fichero de
configuración. Por ejemplo, si el período son dos horas, todos los accesos desde un
determinado host en menos de dos horas después del primer acceso son agrupados en una
sesión. Todos los siguientes accesos después de las dos horas son contados en una nueva
sesión. De esta forma usted puede estimar el número de sesiones que han empezado en
diferentes sitios para acceder a su servidor. |
|
Nuestro manual de apoyo en línea se actualiza
mensualmente para reflejar los nuevos procedimientos y cambios en el servicio. |
|
|
| |
|
| |
 |
© 2000-2001
TodoRed |
 |
|