AlchemyAPI – Analys av textmassor

I vissa av mina projekt så är jag i behov av att automatiskt tagga upp text. Och efter att ha testat ett antal olika API:er som tillhandahåller detta så tänkte jag dela med mig av mina erfarenheter i form av en serie blogginlägg.

Först ut att testas är AlchemyAPI som verkar vara det mest avancerade när jag tittar på deras hemsida ”AlchemyAPI utilizes machine learning and natural language parsing technology, analyzing web or text-based content to identify people, organizations, locations, and other information!”.

Nåväl, först och främst så tar jag en exempeltext som jag avser att jämföra mellan de tre API:erna (hämtad från PRNewsWire.com).

Efter att införskaffat en API-nyckel från AlchemyAPI så skriver jag om den exempelkod som hittas i examples/keywords.php till att se ut enligt nedan. Exempelkoden kan hittas i deras SDK.

<?php

 // Load the AlchemyAPI module code.
 include "../module/AlchemyAPI_CURL.php";

 // Create an AlchemyAPI object.
 $alchemyObj = new AlchemyAPI();

 // Load the API key from disk.
 $alchemyObj->loadAPIKey("api_key.txt");

 $xml = $alchemyObj->TextGetRankedKeywords(file_get_contents("/home/je/exempeltext.txt"));
 $result = simplexml_load_string($xml);

 foreach($result->keywords->keyword as $key) {
     echo $key->text.", ";
 }

 echo "\n";
?>

Nyckelorden som kommer fram ur texten är följande:

FIPS 140-2, fips 140-2 validation, secure mobile voice, voice calling security, Federal Information Processing Standard, Secure Voice, Cellcrypt products, Cellcrypt’s cell phone, certificate provides assurance, PALO ALTO, mobile phone, cryptographic module, highest standard, gateway applications

Här hämtar du hem PHP SDK:

Testa även deras demo-sida som visar lite mer vad de är kapabla till. Samt så tillhandahåller de även ett WordPress-plugin.

3 reaktioner på ”AlchemyAPI – Analys av textmassor

  1. Daniel: Det är korrekt. Varken OpenCalais eller AlchemyAPI fungerar bra med svensk text. Dock har vi ju Saplo här i Sverige som förhoppningsvis gör det bättre! Har dock inte fått tillgång till deras API

Lämna ett svar

E-postadressen publiceras inte. Obligatoriska fält är märkta *