Ord och ingenjörer i ensidigt sällskap

Det är trängsel i lobbyn till hotellet Hyatt Regency i Seattle. Den sextonde konferensen för det nordamerikanska förbundet för datorlingvistik, eller NAACL 2022, är igång. I folkvimlet fäster sig min blick vid namnbrickorna som susar förbi. Teknologijättar som Google, Amazon, Microsoft, Apple är välrepresenterade, likaså kända forskningsuniversitet som MIT, Cambridge och Stanford. Inom fältet för artificiell intelligens (AI) är det ett tiotal konferenser som dominerar, däribland NAACL. Här kan vi få en glimt av de språkliga förmågorna AI kan uppvisa då de mest avancerade modellerna kopplas ihop med den bästa möjliga finansieringen och all data den kan ge tillgång till.

Jag yrar fram genom folkmassan tillsammans med min kollega, Jack LaViolette, doktorand i sociologi på Columbia University. Vi har blivit godkända till konferensen med ett väldigt udda inlägg. I vår artikel granskar vi hur två lingvister, engelsmannen J.R. Firth och amerikanen Zellig Harris, skriver om semantik. Firth och Harris var båda inflytelserika under efterkrigstiden men är rätt okända idag, med åtminstone ett undantag: inom datorlingvistiken – alltså forskningen kring språk och AI – citeras de med exponentiell ökning sedan ungefär 2010. Trenden är märklig eftersom datorlingvistiken sitt namn till trots idag befattar sig allt mindre med lingvistisk teori. Varför, undrade Jack och jag, ökar intresset för dessa två figurer då så explosivt?

En granskare menade att vår artikel var ”synnerligen ovanlig” och ”inte nödvändigtvis lämpad för NAACL”. Samtidigt menade samma granskare att ”detta eventuellt är en av våra konferensers begränsningar”. Andra granskare höll med. Vår artikel var intressant, men var en typ av självrannsakan som inte just förekommer på NAACL 2022 eller andra motsvarande konferenser. Som tur för oss överskred granskarnas nyfikenhet ändå deras skepsis.

Granskarnas omdömen av vår artikel påminner mig trots det om ett bredare problem inom AI-forskning som även blev synligt under konferensen. Fältet avancerar med stormsteg, men forskningen är på många sätt ytterst närsynt. Det var förbryllande under konferensen att lyssna på hur unga, briljanta doktorander presenterade tekniskt otroligt avancerad forskning samtidigt som de i värsta fall var helt oförmögna att placera den i ett socialt sammanhang. Även de som gav forskningen en social motivering förlitade sig i de flesta fall på ytterst naiva teorier om samhälle och politik. Forskning som presenterades som ”samhällsvetenskaplig” handlade förutom några få undantag helt och hållet om näthat – ett i grunden politiskt och socialt problem som här endast greppades i tekniska termer.

AI-forskningens närsynthet framkom tydligt för oss även då vi författade vår artikel om Firth och Harris. Inspirerad av logik och tidig informationsteori utvecklade Harris, även känd som Noam Chomskys doktorandhandledare, en hermetiskt sluten teori om språket. För Harris får orden sin betydelse endast i sitt sammanhang med andra ord. Liksom den strukturalistiska lingvistikens förfader Ferdinand de Saussure menade Harris att ett ords mening endast kan definieras relativt genom de andra ord ordet i fråga förekommer med. Språket var för Harris ett informationssystem som skulle studeras utan intrång från andra vetenskaper så som historia, antropologi och sociologi.

Firth var däremot skolad av antropologen Bronisław Malinowski. Han höll i stora drag med om Harris vad gällde ordens förhållande till andra ord, men tvärtemot Harris menade Firth att språket alltid måste greppas i sitt bredare sammanhang. I ett samtal förhåller sig ett ord inte endast till andra ord, utan även till olika objekt och personer som deltar i situationen. I Firths teori har språket och den övriga världen ontologisk jämlikhet, medan de är ofrånkomligt separerade hos Harris.

Fast Harris och Firth ofta citeras i samma sammanhang, har de alltså en dramatiskt skild syn på språket. Den ena uppfattade språket som ett logiskt slutet system, den andra som ett öppet fält med porösa gränser till världen. Denna kontrast mellan en matematisk och en antropologisk syn på språket återspeglas i AI-forskningen idag, som i praktiken följer Harris program, trots referenserna till Firth.

Då vi stiger upp på podiet för att ge vår presentation under den sista dagen av årets NAACL, känner jag mig ovanligt nervös. Bland all teknisk forskning är vår presentation onekligen udda. Men bemötandet är positivt, vår självrannsakan verkar välkommen. Ändå gör den sist och slutligen knappast någon större skillnad. Problemet är satt i system. Under tidigare år har även andra forskare försökt idka samhällsvetenskaplig och filosofisk kritik. Emily Bender, datalingvist vid University of Washington, har redan sedan några år tillbaka ifrågasatt grundpremisserna som majoriteten av hennes fält numera följer och talade även under en panel på årets NAACL.

Men denna typ av punktinsatser rubbar knappast grundstrukturen i AI-forskningen. Den teknologiska forskningen stormar framåt, medan den filosofiska och samhälleliga debatten släntrar efter på annan ort. Liksom all teknik, går datalingvistiken sin gilla gång, med nominella nickningar till fältets teoretiska grunder (Firth och Harris i detta fall) och tafatta gester gentemot samhällsvetenskaperna. Det är förstås inget sammanträffande, utan i linje med de intressen som finansierar fältet. Konferensens största sponsorer, inklusive Google, Amazon, Meta, Apple, Microsoft och ByteDance, vill se tekniska framsteg. Konsekvenserna av tekniken följer sedan som en eftertanke.

I debatter kring AI och motsvarande teknologi är det bra att minnas att den alltid utvecklas i en liten värld, där ingenjörer endast håller sällskap med andra ingenjörer, lite som språkets ord endast håller sällskap med andra ord i Harris teori. Om vi någon dag får bevittna utvecklingen av AI (och även annan teknologi) på andra premisser, kommer den att härstamma från ett bredare sällskap där olika karaktärer möter varandra, precis som orden i Firths teori även håller sällskap utanför språket och dess former.