Teknologin bakom automatisk textanalys

Vi ser runtomkring oss hela tiden, utan att tänka på det, olika system som är sammansatta av mindre byggstenar eller beståndsdelar. När vi ser ett hus reflekterar vi oftast inte över de tegelstenar, träbitar, fönsterrutor o.s.v., som huset är uppbygt av. Snarare tänker vi på funktionen som deras sammansättning uppfyller. Om samma byggmaterial ligger på marken har två tegelstenar ingen fixerad inbördes relation, vilket de har när den ena sitter på taknocken och den andra sitter vid fundamentet.

Även i mänskliga relationer ser man samma fenomen. Två personer som känner varandra väl ändrar sitt inbördes beteende när en tredje person kommer i deras närhet, och när många människor samlas bildas samhällen som tillhandahåller produkter och tjänster som inte en enskild individ skulle kunna leverera. Naturen själv bygger på samverkan mellan byggstenar av olika slag och storlek.

Samma resonemang kan användas på språkets funktion och uppbyggnad. Beståndsdelarna är de enskilda orden samt vissa grammatiska regler, men den egentliga innebörden i det som sägs och skrivs utgörs av hur orden kombineras ihop, och precis som i naturen är det oftast svårt att på ett enkelt sätt beskriva vad det är som ger upphov till något man observerar eller uppfattar. Saplos produkter bygger på teknologier som kan känna igen och mäta samband mellan ord som inte är enkelt uppenbara. Med hjälp av detta kan man hitta väsentliga karaktäristiska drag i meningar och texter som sedan kan användas dels för olika jämförelser, och dels för att försöka finna en relation mellan en text och andra företeelser såsom värderingar, känslor, trender, faktiska kvantiteter och tal osv.