Connaissances Informatiques >> programmation >> Computer Programming Languages >> Content
  Derniers articles
  • Comment convertir ColdFusion pour PH…
  • Comment faire pour convertir une let…
  • Comment convertir une liste à un da…
  • Comment diviser les valeurs d'un dom…
  • Comment trier les colonnes dans Data…
  • Instructions de programmation API 
  • Comment faire pour intégrer SRC dyn…
  • Comment insérer une ligne en utilis…
  • Tutoriel pour Microsoft Visual Studi…
  • Comment apprendre le langage structu…
  •   Computer Programming Languages
  • C /C + + Programming

  • Computer Programming Languages

  • Delphi Programming

  • Programmation Java

  • Programmation JavaScript

  • PHP /MySQL Programmation

  • programmation Perl

  • Programmation Python

  • Ruby Programming

  • Visual Basics programmation
  •  
    Computer Programming Languages

    Comment faire un Web Bot

    moteurs de recherche, comme Google ou Yahoo! , tirez pages Web dans les résultats de recherche en utilisant les robots collecteurs de Web ( parfois aussi appelé araignées ou robots ) , qui sont des programmes qui scannent les sites Internet et d'index dans une base de données . Bots Web peuvent être faites en utilisant la plupart des langages de programmation, dont C , Perl , Python et PHP , qui permettent aux ingénieurs de logiciels d'écrire des scripts qui exécutent des tâches procédurales, telles que l'analyse Web et de l'indexation . Instructions
    1

    Ouvrez un texte demande plaine d'édition, tel que Notepad , qui est fourni avec Microsoft Windows ou TextEdit de Mac OS X , où vous voulez auteur d'une application Web Bot Python.
    < Br > 2

    Lancer le script Python en incluant les lignes de code suivantes , et en remplaçant l'exemple URL par l'URL du site que vous souhaitez numériser et le nom de la base de données exemple avec la base de données qui sera stocker les résultats :

    import urllib2 , ré, stringenter_point = ' http://www.exampleurl.com ' database = ' example.sql '
    3

    inclure les lignes suivantes de code à définir la séquence d'opérations que le bot Web suivra :

    def uniq (SEQ ): set = {} carte ( set.__setitem__ , SEQ , []) set.keys de retour ()
    < br > 4

    obtenir le URL dans la structure du site en utilisant les lignes de code suivantes:

    def geturls (URL): items = [] = demande urllib2.Request (url) request.add.header ( 'User' ), contenu » Bot_name ;) '= urllib2.urlopen ( demande) . read () = articles re.findall ( ' href = " http://. ? "', contenu) urls = [] retour urls
    5

    Définir la base de données que le bot Web utilisera et précise quelles informations il doit stocker pour compléter rendre le Web Bot :

    db = open ( database , 'a') allurls = uniq ( geturls ( enter_point ) )
    6

    Enregistrez le document texte et de le transférer vers un serveur ou un ordinateur avec une connexion Internet où vous pouvez exécuter le script et commencer numérisation de pages Web .

     
    Article précédent:
    Article suivant:
    Articles recommandés
  • Comment faire pour modifier les marges de cadre à l'aide HTML Programmation 
  • Comment faire pour installer Norstar SCIC 
  • Comment congeler les fichiers Internet temporaires créés dans InfoPath 2007 
  • Comment faire votre propre HTML 5 jeu 
  • Comment faire un compte à rebours en ActionScript 
  • Outils d'évaluation de développement 
  • Comment se débarrasser des erreurs AppleScript 
  • Algorithmes de base dans les structures de données 
  • Comment configurer l'authentification Radius 
  • Comment faire pour convertir une colonne de DataView à un Integer 
  • Connaissances Informatiques © http://www.ordinateur.cc