Detalles técnicos

El script está hecho en python y el código fuente está disponible de acuerdo con la licencia GPL. Para poneros en contacto con nosotros enviad un email a esta dirección.

  1. ¿De dónde viene el nombre del programa (gec)?

    Viene de GEnerador de Conexiones. Por otra parte, en catalán gec significa chaqueta. La que nos ponemos para protegernos de la LSSICE. :-)

  2. ¿Qué es necesario para ejecutar el script?

    En principio solamente es necesario tener instalado el intérprete de python. Existen versiones para Linux (busca el paquete en la página de tu distribución o descarga las fuentes), freeBSD, windows y mac.

    Se ha probado en linux-2.2.18 con python-2.1.3 y en windowsXP y windowsMe con python-2.2.1 con éxito. No hay ningún motivo para que no funcione con otros sistemas operativos y otras versiones de python. En cualquier caso, si en vuestro caso no funciona, ponéos en contacto con nosotros.

    Desde la versión 0.3 existe una versión ejecutable para windows que no necesita que el intérprete de python esté instalado.

  3. Hay una versión ejecutable para windows, ¿y para Mac?

    Estamos trabajando en ello. Aún así, si alguien lo ha conseguido ya y quiere compartir su logro con el resto de los internautas... que se ponga en contacto con nosotros.

    También se aceptan donaciones de macs. :-)

  4. ¿Cómo se instala?

    En cualquier caso, sólo hay que descomprimir todo el archivo ZIP en un directorio y ejecutar el programa.

  5. ¿En qué consiste?

    El script toma de forma aleatoria (o secuencial) las direcciones de un fichero de texto y las visita a intervalos más o menos regulares.

  6. ¿Es ilegal?

    No, en absoluto. No hay ninguna diferencia entre usar este programa y visitar las páginas con un navegador cualquiera.

  7. ¿Cargará mucho el ordenador?

    No necesariamente. En el fichero de ejemplo hemos incluido direcciones de páginas de menos de 100 KB. Con esto, y eligiendo un período entre conexiones de unos cuantos minutos, las conexiones no afectarán perceptiblemente al rendimiento del sistema.

  8. ¿Consumirá mucho ancho de banda?

    No necesariamente. Si se eligen bien los parámetros, el consumo puede ser mucho menor que la descarga de un programa de tamaño medio.

  9. ¿Cómo se usa?

    Si nos parecen bien los valores por defecto, el directorio en el que está python se encuentra en el PATH y el script y el fichero de direcciones se encuentran en el directorio actual, podemos escribir:

    python gec-cat.py

    o bien en linux/unix

    ./gec-cat.py

    Claro está que se pueden tener los ficheros donde a uno le venga bien; por ejemplo

    c:\python22\python a:\gec-cat.py c:\temp\fichero_direcciones.txt

    o bien (en linux/unix)

    /mnt/floppy/gec-cat.py /tmp/fichero_direcciones.txt

    Si queremos modificar su comportamiento, podemos usar las distintas opciones que ofrece el programa. Por ejemplo

    python gec-cat.py -v 1 -t 4.2 -d 186 -m 300 fichero_direcciones.txt

    o bien (en Linux/Unix)

    ./gec-cat.py -v 1 -t 4.2 -d 186 -m 300 fichero_direcciones.txt

    Se conectará 300 veces de forma aleatoria a las páginas del fichero indicado. El tiempo mínimo entre dos conexiones será de 4 minutos y 12 segundos; el máximo, 7 minutos y 18 segundos. Además, aparecerán en pantalla mensajes informativos (activado por omisión).

    En cualquier caso, basta con ejecutar el programa con la opción -h para obtener una descripción de los párametros y argumentos. Para la versión actual la ayuda en pantalla es la siguiente:

    gec 0.6  Este programa se distribuye bajo la versión 2 de la licencia GPL.
    
    
    gec 0.6.1 (16-4-2003)
    
    USO: gec [OPCIONES] nombre_fichero
    
      OPCIONES:
      -h		muestra esta pantalla de ayuda y finaliza.
      -m M		se realizarán sólo M conexiones
      		(por omisión: 288 conexiones).
      -t N		se realitzará una conexión cada N minutos
      		(por omisión: una cada 3 minutos y 51 segundos).
      -d S		introduce un aumento máximo de S segundos sobre el tiempo de
      		connexión (por omisión: 2 minutos y 15 segundos).
      -s		se realizará una conexión a cada una de las
    		páginas del fichero en el orden en que aparecen
    		(por omisión el orden es aleatorio).
      -p P		sigue los enlaces de la página hasta la profundidad indicada.
      -g C		realiza una búsqueda en el Google cada C conexiones, como
      		máximo (por omisión el valor es 10).
      -f fichero	especifica el nombre del fichero en el que se encuentran
      		las palabras que se usarán para las búsquedas en el Google.
      -v L		grado de prolijidad: 0 = silencio; 1 = todos los mensajes 
      		(por omisión es 1).
    
      nombre_fichero	indica el fichero en el que figuran las direcciones de
    			las páginas a las que se conectará.
    
    		
  10. ¿Cómo se usa el ejecutable?

    En el caso del ejecutable (sólo para windows), los parámetros y argumentos son exactamente los mismos. Por ejemplo:

    gec-cat.exe -v 1 -t 4.2 -d 186 -m 300 fichero_direcciones.txt

  11. ¿Cómo se para el programa?

    Si se indica un número máximo de conexiones, la ejecución se interrumpe cuando se han efectuado (el valor por omisión es 288). Para interrumpir el programa pulsa CTRL-C (aguantando la tecla CONTROL pulsa 'c'). Hay que tener un poco de paciencia: no se interrumpirá hasta que realice la siguiente conexión.

    El programa se puede interrumpir mediante métodos más expeditivos: no hay peligro. :-)

  12. ¿Se puede usar cualquier fichero de direcciones?

    Siempre que haya una dirección por línea.

    Hay que tener en cuenta, sin embargo, que el éxito del script depende de la bondad del fichero de direcciones. Recordemos que nuestro objetivo es dificultar al máximo la elaboración de perfiles comerciales, ideológicos, etc. de los internautas; para ello es necesario que en dicho fichero se encuentren páginas de todo tipo (especialmente aquellas que no visitamos o no visitaríamos).

  13. ¿Qué novedades incluye la versión 0.5?

    A partir de la versión 0.5, el script es capaz de seguir los enlaces que encuentra en la página visitada. Además, esto se puede realizar de forma recursiva: puede seguir los enlaces que encuentre en la página a la que se conecta procedente de otra.

    De entre los enlaces que se encuentran en la página visitada se elige al azar uno y, tras el correspondiente retardo, se visita.

    Para ello hay que usar la opción -p seguida de un entero positivo, que indica la "profundidad" (por ejemplo, si indicamos -p 2 el script seguirá uno de los enlaces incluidos en la página visitada, buscará enlaces en ésta y visitará uno de ellos; después volverá a la lista original de direcciones).

    Hay que decir que sólo se siguen los enlaces del tipo "text/html"; en caso de no encontrar ningún enlace "válido", se vuelve a la lista original.

    Con esta opción activada no es posible predecir qué páginas visitará el programa. Aquellas personas que no quieran "perder" el control del mismo han de usar la opción -p 0.

  14. ¿Qué novedades incluye la versión 0.6?

    A partir de la versión 0.6, el programa es capaz de seguir cualquier enlace (relativo o absoluto, con comillas o sin ellas) que encuentre en la página visitada.

    Además, con la opción -g G se efectúa como máximo una vez cada G visitas una búsqueda en el Google con dos palabras tomadas al azar del fichero paraules-cat.txt o paraules-cas.txt o de cualquier otro fichero que se especifique tras la opción -f al ejecutar el programa. A partir de aquí, el rumbo que tome el programa es absolutamente impredecible; por tanto, aquellos que deseen tenerlo bajo control han de usar la opción -g 0.

  15. ¿Por qué realiza el programa búsquedas aleatorias en el Google?

    Porque es, con mucho, el buscador más usado y porque su política de protección de datos deja que nucho que desear. Véase, por ejemplo: Google Watch y ¿Big Brother Google? (en Barrapunto).

  16. ¿Se puede usar otro fichero de palabras?

    Siempre que haya una por línea. De hecho, habría que ir cambiando de fichero o ampliando periódicamente (qunque con las que proporcionamos hay más de diez mil combinaciones).

  17. ¿Es posible que los ISPs (u otras personas) sepan que se trata de un programa y no de una persona?

    Es muy probable que sí.

    Los programas que hacen las estadísticas de visitas a páginas web se fijan sólo en el nombre que el cliente envía; así, en las pruebas realizadas, este script pasa por Mozilla sin ningún problema. Sin embargo, si se utilizan métodos más refinados... Por este motivo estamos añadiendo características al programa y puliendo las ya existentes; hay una lista de asuntos pendientes en la que podéis consultar los avances que realizamos.

    De todas formas, este es un gesto reivindicativo: no pretendemos garantizar la intimidad en la navegación. Se trata de demostrar que no se puede vigilar a todo el mundo sistemáticamente y de dificultar la elaboración de perfiles comerciales, ideológicos, etc.

  18. ¿Pueden los ISPs "filtrar" estas conexiones para "limpiar" los ficheros en los que registran nuestras conexiones?

    Es probable que sí.

    Una de las formas es usar el fichero de direcciones que distribuimos con GEC. Sin embargo, cada uno puede usar las direcciones que quiera y cambiarlas periódicamente. Por otra parte, usando un método tan "tosco" eliminarían muchas conexiones "normales"...

    De cualquier modo, en versiones posteriores nos aseguraremos de que GEC sea más difícil de filtrar.

  19. ¿No será este un intento de aumentar el número de visitas de determinadas páginas?

    No. :-) De hecho, la versión 0.6.1 se diferencia de la anterior exclusivamente en que no sigue los enlaces publicitarios del Google.

    En todo caso, cada cual que se genere su fichero de direcciones...

  20. ¿Tiene bugs conocidos?

    En la línea de órdenes de windows, los caracteres más allá del 127 no se muestran correctamente. Resolverlo es trivial, pero nos falta tiempo.

  21. ¿Me puedo fiar de este script?

    Nunca os fiéis de nadie: ejecutadlo con los mínimos permisos posibles (no necesita nada especial) y, si sabéis algo de programación, leed el código antes de instalarlo.

    Antes de usar la versión ejecutable usad un antivirus.

    Las sumas de comprobación (MD5) dan los siguientes resultados

    		versión 0.2
    		021db555a7933170a90f451993e33a8d  gec-cas.py
    		676f96b5d9d1743eed21c4aafe1b8ab1  gec-cat.py
    		
    		
    		versión 0.3 (script)
    		ef150d1815e869ed9bcb75bd4ade0416  gec-cas.py
    		a6226d95776b221fdc31301c8645fa73  gec-cat.py
    		
    		versión 0.3 (ejecutable)
    		b9c0526421185066644af022afd297e7  gec-cas.exe
    		a796e570ad149fe6e19ba7d818a68b28  gec-cat.exe
    		
    		
    		versión 0.4 (script)
    		e649b9a7699a429598fdd535e99a0fa5  gec-cas.py
    		7f46872ef44528f5da785879a53aa1af  gec-cat.py
    		
    		versión 0.4 (ejecutable)
    		c57739c7b9a55ae7e3afaddad438e9de  gec-cas.exe
    		a1399596bfc16ed7457b8380201c40fc  gec-cat.exe
    
    
    		versión 0.5a (script)
    		819ff3212f9a56614d30c441d3043fc4  gec-cat.py
    
    		versión 0.5a2 (script)
    		e9dc166986567c84f96e4f803fb5e5d0  gec-cat-a2.py
    
    		versión 0.5a3 (script)
    		3276480853dfb4baf41e8bb75f7e396a  gec-cas-a3.py
    		ba222656d24c347261b7a2217b2ccd9a  gec-cat-a3.py
    
    		versión 0.5b (script)
    		ed5169e019708a454202a3ac6bcaa241  gec-cat.py
    
    
    		versión 0.6a (script)
    		e7a962aecfc9edb9769c9f85802ab02b  gec-cat.py
    
    		versión 0.6 (script)
    		4f6c12fbf44a6fbecbe4b229e62c27bc  gec-cas.py
    		df7b2f8af4e7ce4e047a8c3e557c7a20  gec-cat.py
    
    		versión 0.6 (ejecutable)
    		6b1034675c5d1308495d202e162363bc  gec-cas.exe
    		080cdff1f5aaa28f31f96bf914178b9d  gec-cat.exe
    		
    		versión 0.6.1 (script)
    		2137ed2ff317fa38f817a2448aaa3c4e  gec-cat.py
    		025ffdaddfd252997acfbaa6fa77c620  gec-cas.py
    
    		versión 0.6.1 (ejecutable)
    		df75c1a3d9ee2ff66d35511a316ea1d2  gec-cas.exe
    		742924e855934aad5ae696e528216eca  gec-cat.exe