Etikettarkiv: pdfind

Nya projekt, buggtester, CDN, PDFind

Buggtesterna på Bloggy fortgår och jag fixar runt 5-6 buggar dagligen vilket bör innebära att jag öppnar upp för en publik beta kanske redan nästa vecka. Vill du ha en invite? Gå till bloggy.se och ange din E-post så lovar jag att skicka ut en invite när det är dags.

**

Den blogginformation/data jag besitter verkar vara intressant och diverse sammarbeten gällande min bloggsökmotor Bloggz har inletts.

**

DomainTool.se vilket är en domän informations-tjänst som jag utvecklade för ca ett halvår sedan börjar få mer besökare och är uppe i en tredjedel av antalet besök som Download11 genererar. Så därför har jag börjat att utveckla en storebror som troligtvis inte tar för mycket tid att utveckla.

**

Då mina tjänster kräver mer och mer kapacitet så har jag börjat att snegla på diverse CDN (Content delivery networks) och SimpleCDN.com verkar trevligt. Läste just även att Amazon kommer att släppa en CDN-tjänst. Tillsvidare så har jag dragit igång ett gäng servrar hemma som får göra krävande beräkningar.

**

PDFind.com blir trevligare och trevligare för var dag och snart kanske värdig att kallas BETA.

Hitta PDF-dokument

Då var jag hemma i Sverige igen med nya krafter och idéer på projekt. Under tiden som jag var borta så lät jag en av mina spindlar stå och söka av webben efter PDF-dokument och nu när jag tittade så fanns det över 100 000 stycken PDF-dokument som väntas på att parsas och läggas upp på PDFind.com. Förhoppningsvis så kommer Google att indexera sajten och se att det är unikt content, men det återstår att se.

Google indexerar flash, Hitta PDF-filer och bloggvärde

Google börjar att indexera flash-filer (SWF):

We’ve developed an algorithm that explores Flash files in the same way that a person would, by clicking buttons, entering input, and so on. Our algorithm remembers all of the text that it encounters along the way, and that content is then available to be indexed. We can’t tell you all of the proprietary details, but we can tell you that the algorithm’s effectiveness was improved by utilizing Adobe’s new Searchable SWF library.

Intressant! Själv använder jag dock flash mycket sparsamt på mina sajter men ska bli intressant och se om detta har någon direkt effekt på SERP:en. Vad tror du?

**

Får snart fiber hem till lyan och då ska det börjas att crawla igen, först ut är en sökmotor för PDF-filer som ska gå under domänen PDFind.com. Crawlingshastigheten ligger på ungefär 10 miljoner webbsidor per dygn.

**

BloggVärde.se har nu värderat ca 40 000 Svenska bloggar.