AlchemyAPI – Analys av textmassor

2010-05-20 – 19:00

I vissa av mina projekt så är jag i behov av att automatiskt tagga upp text. Och efter att ha testat ett antal olika API:er som tillhandahåller detta så tänkte jag dela med mig av mina erfarenheter i form av en serie blogginlägg.

Först ut att testas är AlchemyAPI som verkar vara det mest avancerade när jag tittar på deras hemsida ”AlchemyAPI utilizes machine learning and natural language parsing technology, analyzing web or text-based content to identify people, organizations, locations, and other information!”.

Nåväl, först och främst så tar jag en exempeltext som jag avser att jämföra mellan de tre API:erna (hämtad från PRNewsWire.com).

Efter att införskaffat en API-nyckel från AlchemyAPI så skriver jag om den exempelkod som hittas i examples/keywords.php till att se ut enligt nedan. Exempelkoden kan hittas i deras SDK.


<?php

 // Load the AlchemyAPI module code.
 include "../module/AlchemyAPI_CURL.php";

 // Create an AlchemyAPI object.
 $alchemyObj = new AlchemyAPI();

 // Load the API key from disk.
 $alchemyObj->loadAPIKey("api_key.txt");

 $xml = $alchemyObj->TextGetRankedKeywords(file_get_contents("/home/je/exempeltext.txt"));
 $result = simplexml_load_string($xml);

 foreach($result->keywords->keyword as $key) {
     echo $key->text.", ";
 }

 echo "\n";
?>

Nyckelorden som kommer fram ur texten är följande:

FIPS 140-2, fips 140-2 validation, secure mobile voice, voice calling security, Federal Information Processing Standard, Secure Voice, Cellcrypt products, Cellcrypt’s cell phone, certificate provides assurance, PALO ALTO, mobile phone, cryptographic module, highest standard, gateway applications

Här hämtar du hem PHP SDK:

Testa även deras demo-sida som visar lite mer vad de är kapabla till. Samt så tillhandahåller de även ett WordPress-plugin.

Gillar du detta inlägg? Sharing is caring:
Bloggy Pusha Facebook TwitThis Maila artikeln! Skriv ut artikeln!
Du bör också läsa något av följande inlägg:
  1. 3 Responses to “AlchemyAPI – Analys av textmassor”

  2. Firefox 3.6.3Windows 7

    Hej! Kul att du går i samma tankar som jag :) Jag letar mer specifikt efter ett taggningsbibliotek för svenska, säg gärna till om du hittar något bra!
    .-= Emil Stenström senaste inl&auml;gg blog ..Lazy Loading Asyncronous Javascript =-.

    Skrivet av Emil Stenström, Maj 20, 2010

  3. Firefox 3.6.3Windows 7

    AlchemyAPI verkar identifiera svenska taggar bra.

    Prova på deras demosida.

    Skrivet av Daniel, Maj 27, 2010

  4. Firefox 3.6.3Windows 7

    Daniel: Det är korrekt. Varken OpenCalais eller AlchemyAPI fungerar bra med svensk text. Dock har vi ju Saplo här i Sverige som förhoppningsvis gör det bättre! Har dock inte fått tillgång till deras API

    Skrivet av Jonas, Maj 27, 2010

Skriv en kommentar

CommentLuv badge