Connaissances Informatiques >> Logiciel >> Portable Document Format >> Content
  Derniers articles
  • Comment faire pour convertir THM en …
  • Comment copier un fichier PDF proté…
  • Comment retourner un fichier Adobe P…
  • Comment mettre en évidence Stuff su…
  • Comment diminuer Mo Taille dans un f…
  • Comment faire un fichier image à pa…
  • Comment agrandir un PDF avec Acrobat…
  • Comment faire pour copier le texte P…
  • Comment afficher les noms des champs…
  • Comment exporter un rapport au forma…
  •   Portable Document Format
  • Adobe Illustrator

  • Un logiciel d'animation

  • antivirus Software

  • Logiciel audio

  • Sauvegarder des données

  • Gravez des CD

  • Gravez des DVD

  • Compression de données

  • Logiciel de base de données

  • desktop Publishing

  • desktop Video

  • Digital Video Software

  • Drupal

  • Logiciels éducatifs

  • Software Engineering

  • Types de fichier d'extension

  • Financial Software

  • Freeware , Shareware et Abandonware

  • GIMP

  • Graphics Software

  • Accueil Recording Software

  • Microsoft Access

  • Microsoft Excel

  • Microsoft Publisher

  • Microsoft Word

  • Code Open Source

  • Autres logiciels informatiques

  • Jeux PC

  • Photoshop

  • Portable Document Format

  • PowerPoint

  • Logiciel de présentation

  • Logiciels de productivité

  • Quicktime

  • Gestion Remote Desktop

  • SQL Server

  • Skype

  • Logiciel bêta de presse

  • Consultants logiciels

  • Les sociétés de développement de logiciels

  • Licences de logiciels

  • Tableur

  • Logiciel de préparation d' impôt

  • Logiciel utilitaire

  • Clip Art Web

  • Windows Media Player

  • Logiciel de traitement de texte
  •  
    Portable Document Format

    Comment Index et Recherche un PDF en Java avec Lucene

    Apache Lucene est un texte bibliothèque de moteur de recherche complet, écrit en Java. Vous pouvez utiliser Lucene pour indexer et rechercher tout type de document texte. Pour convertir un fichier Portable Document Format (PDF ) dans un format de texte qui peut Lucene index, vous pouvez utiliser la classe open source PDFBox qui possède des méthodes spécifiquement pour Lucene. Il suffit de fournir le nom du fichier PDF à PDFBox et obtenir un objet Document Lucene qui peut être ajouté à l'indice et fouillé comme n'importe quel fichier texte. Instructions
    1

    Sélectionnez un analyseur Lucene à utiliser dans la création de l' index, par exemple " StandardAnalyzer . " Créer un objet " IndexWriter " pour gérer l'ajout de nouveaux éléments à l'index, par exemple :

    IndexWriter myWriter = new IndexWriter ( "index" , nouveau StandardAnalyzer () , true);
    2 < p> Appel " LucenePDFDocument " pour obtenir un objet Document Lucene de votre fichier PDF . Ajouter d'autres domaines clés de l'objet et ajouter l'objet à l'index Lucene. Par exemple:

    document PDFDoc = LucenePDFDocument.getDoument (filename) ;

    pdfDoc.add ( nouveau champ ( "title" , pdf.getTitle (), Field.Store.YES , Field. Index.TOKENIZED ) ) ;

    pdfDoc.add ( nouveau champ ( " auteur " , pdf.getAuthor (), Field.Store.YES , Field.Index.TOKENIZED ) ) ;

    myWriter . addDocument ( pDFDoc ) ;
    3

    Utilisez la classe " SearchEngine " pour rechercher l'index Lucene. " SearchEngine " retourne un objet " Hits " Lucene avec une liste d' objets " hit" . Par exemple:

    SearchEngine MySearch = new SearchEngine ();

    Visites myHits = mySearch.performSearch ( searchText ) ;

    System.out.println (" Documents présents: " + myHits.length ());
    4

    parcourir les objets " hit" pour obtenir plus d'informations sur chaque match. Les objets " de vie " sont classés par pertinence à la recherche , et vous pouvez également obtenir la note de recherche relatif à " getScore (). " Par exemple:

    Iterator ITR = myHits.iterator ();

    while ( itr.hasNext ()) {

    Hit theHit = itr.next () ;

    document thedoc = theHit.getDocument ();

    System.out.println ( theDoc.get ( "title" ) + "-" + theHit.getScore ()); < br >

    }

     
    Article précédent:
    Article suivant:
    Articles recommandés
  • Comment imprimer plusieurs e-mails vers un fichier PDF 
  • Comment modifier un fichier PDF pour Free 
  • Comment convertir un fichier Adobe PDF à un fichier texte 
  • Comment convertir des documents au format PDF dans Snapshot accès 
  • Comment faire pour convertir un document PDF numérisé vers Excel 
  • Comment faire pour convertir TIF au format PDF gratuitement 
  • Comment créer des étiquettes dans un fichier PDF avec ColdFusion 
  • Comment puis-je visualiser les fichiers PDF 
  • Comment sauvegarder comme PDF dans XP 
  • Comment changer la résolution d'un PDF 
  • Connaissances Informatiques © http://www.ordinateur.cc