Nyskaping

Babels tårn. Slik noen ser det for seg. Kan kunstig intelligens rive ned ­verdens språkbarrierer?

«Kan du ­deeple det?»

Kunstig intelligens revolusjonerer språklig oversettelse. Firmaet Deepl fra Köln gjør det bedre enn Google Translate.

Publisert Sist oppdatert

Andrew Wakeman (32) ligner ikke på en maskin. Amerikaneren jobber som oversetter i Tyskland, har skjegg, øredobber og diverse tatoveringer: to blomster som symboliserer hans døtre, skrift som minner ham om sin avdøde bror, symboler på kjærlighet og sorg – alle er menneskelig utvalgte.

En fin fyr denne Wakeman. Kollegaene har gitt ham kallenavnet «maskinen» fordi han organiserer seg ytterst systematisk. Han utarbeider To-do-lister og med hjelp av en onlinekalender planlegger han arbeidsdagene sine i halvtimes enheter.

– Det gjør meg mer effektiv, sier han. Tysken hans, som han lærte ved universitetet i Indianapolis, har han finpusset med sin tyske kone. Den er plettfri og uten aksent.

Men «maskinen» kan snart byttes ut med en maskin. Eller ikke. Det vet man ikke.

But «The Machine» may soon be replaced by a machine. Or not. You don’t know.

Slik oversatte den kunstig intelligente maskinen DeepL setningen.

Big business

Andrew Wakeman jobber for firmaet Wieners+Wieners fra Ahrensburg som er ledende innen bransjen i tyskspråklig rom. Han oversetter alt kunder trenger fra tysk til engelsk: bruksanvisninger, handelsrapporter, skilsmissedokumenter, motekataloger, reklamefraser ... Wieners+Wieners har 90 ansatte, jobber med 1500 freelancejournalister som til sammen behersker mer enn 70 språk, løser over 40.000 oppdrag i året og tjener 20 millioner euro i et marked som globalt estimeres til 43 milliarder dollar.

Språk er ikke et produkt, men uten språk er ethvert produkt ingenting. Alt det handles med og forhandles om trenger språk og beskrivelse, og siden verden stadig vokser sammen og stadig flere mennesker vil kommunisere med hverandre, blir språk også stadig viktigere. Ludwig Wittgenstein sa at «der grensen for mitt språk går, går grensen for min verden», og disse grensene strekker seg stadig lengre. Oversatt språk er grunnlaget.

DeepL tar over?

Er egentlig globaliseringens medium og internettet en god nyhet for folk som Andrew Wakeman, eller ikke?

La langue traduite est la base, le médium de la mondialisation et de l’Internet – en fait, c’est une bonne nouvelle pour des gens comme Andrew Wakeman, ou non?

Også denne setningen oversatte DeepL på brøkdelen av et sekund. DeepL står for «Deep Learning» – dyp eller nevral læring. Det er en åpen tilgjengelig oversettelsesmaskin på internettet og navnet til et lite tysk firma med sete i Köln som står bak programmeringen av den. Når man skriver inn en tekst i DeepL sendes først denne informasjonen til Island, hvor firmaets datasenter befinner seg. Dette senteret kan utføre fem billiarder regneoperasjoner per sekund. En billiard er et ettall med 15 nuller. Så dukker setningen med ønsket språk opp på skjermen.

På den ene siden er denne informasjonen markedsforspranget vårt. På en annen side kan vi ikke helt forklare det selv

DeepL utfører den samme jobben som Google Translate eller Microsoft Bing-oversettere har gjort i lang tid – bare langt bedre. Da DeepL ble lansert i fjor ble fagfolk og pressen forbauset. «Liten Start-up slår Google», «DeepL gir menneskelige oversettere konkurranse» var noen av overskriftene.

I en blindtest vurderte profesjonelle oversettere 100 setninger som var oversatte av DeepL og maskinene til Google, Microsoft og Facebook. Firmaet forteller at setningene til DeepL tre ganger så ofte ble vurdert til å være bedre enn konkurrentenes.

Språkroboter har lenge blitt ansett som banebrytende for AI-revolusjonen. Nå er de her.

Frykten for automatiseringen

Frykten for automatisering og algoritmenes makt er tiltagende. Det viser seg gjennom søkeforslagene Google gir når man skriver inn «Vil roboter ...» i søkefeltet: «… erstatte mennesket», «... erobre verden», «... ta jobbene fra flere og flere arbeidere».

Men denne frykten vet ennå ikke hva den engster seg for. Kunstig intelligens forblir vanskelig å forstå, og der hvor den allerede finnes, som f.eks. i form av Apples «Siri», irriterer den ofte gjennom sin inkompetanse. Den som vil vite hva AI kan – og er nyttig til – burde teste ut DeepL.

Babels tårn ble som kjent aldri helt ferdig fordi gud ble sur og sendte en stor språkforvirring til menneskene, som vi enda ikke har løst. Man kan si så mye som at kunstig intelligens har potensial til å gjøre denne utfordringen fra Det gamle testamentet betydelig lettere å løse, nemlig å overkomme mangelen på språklig forståelse. Et viktig vendepunkt er allerede nådd, tipper eksperter: globalt oversettes allerede flere språk maskinelt enn de gjøres av mennesker.

Det er ikke lenger utenkelig at man kan ha en online oversetter implantert i øret som forstår alle språk, og som oversetter på direkten, slik som den velkjente Babelfisken i Douglas Adams science-fiction-roman «Haikerens guide til galaksen». Google Pixel Buds finnes allerede, og de prøver på nettopp dette. Det finnes også et merkelig japansk språk-apparat med navn «ili», som kan brukes til å bestille en øl. Og det finnes en live-oversettelsesfunksjon for Skype-konferanser hvor deltakerne snakker forskjellige språk. Fungerer disse tingene perfekt? Overhodet ikke, men de lærer.

Google-etterligning med egen kraft

Foto Jaroslaw Kutylowski er teknisk direktør for oversettelsestjenesten DeepL. (Foto: Twitter)

Utviklerne av oversettelsesprogramvaren DeepL har ikke sete i Silicon Valley, men i femte etasje i en businesspark i Köln. Teknisk direktør Jaroslaw Kutylowski leder oss mellom rommene. De har en lounge med fargerike sakkosekker litt etterligning av Google kanskje, det er et bordtennisbord der, i kontorene henger whiteboard-tavler tilskriblet med gåtefulle formler. DeepL har bare 22 ansatte, deriblant 10 programmerere. Dr. Kutylowski (35) er en slurvete barbert mann, promovert dataspesialist av polsk avstamning. Over kjeks og kaffe forteller han om firmaets historie, som også er maskinoversettelsens historie.

– Vi begynte for omtrent ti år siden. Den gang fantes det bare ordbøker for oversettelser, men på internett kunne man finne mange tospråklige tekster. Oversettelser av tilfeldige setninger og begrep i millionvis. Grunntanken var at når man vil oversette noe, så har sikkert noen gjort før oss. Man må bare finne det.

Firmaet DeepL, som het Linguee frem til i fjor, har bygget såkalte Crawler. Det er programmer som gjennomsøker internettet etter ord- og setningspar.

– Men 98 prosent av disse oversettelsene er bare tull, forteller Kutylowski. For å skille ut det man kan bruke ga man profesjonelle menneskelige oversettere et par tusen setningspar og ba dem om å vurdere kvaliteten, og om å rette feilene.

Resultatene var fortsatt ikke særlig gode. Som alle andre jobbet Linguee den gang med såkalt statistisk metode. Der deler programvaren setningene inn i setningsledd, tildeler dem en sammensetnings-sannsynlighet og setter deretter informasjonen sammen på nytt i ønsket språk. Da kommer det åpenbart mye rart ut. For ikke alt for lenge siden var det morsom underholdning å søke etter «Google Translate Fails». Man fant dem på utenlandske menyer: «En grønnsakshøne tilberedte seg i wok med en hasselnøtt»). Eller på skilt ved tyske severdigheter: «Omvisning i borgen kun med i følge med Der Fuhrer».

Men så, for omtrent tre år siden, kom nevrale oversettelsers inntog. Kutylowski forteller:

– Vi så raskt at det fungerte veldig godt, og at vi kunne overgå de etablerte konkurrentenes kvalitet.

Men hvorfor? Det virker som om ingen egentlig kan forklare det. Selv folkene fra DeepL som kanskje kan, tier.

– De er ganske reserverte, sier Josef van Genabith fra oversettelsesorientert språkteknologisk institutt ved Universitetet i Saarbrücken. Datalingvistenes forskerkretser «kjente inntil nylig knapt til DeepL». Desto større var forbauselsen over hva programmet evnet.

Kutylowski møter stadig oftere kritikk av sin hemmeligholdelse. Han får forespørsler fra hele verden om å publisere en rapport om funnene deres. Han ber om forståelse:

– På den ene siden er denne informasjonen markedsforspranget vårt. På en annen side kan vi ikke helt forklare det selv.

Det han vet, er at det allerede finnes brukere som gjør om DeepL til et verb. «Jeg deeplet det», «kan du deeple setningen?». Å «google» står jo allerede i ordboka. Kanskje havner til slutt også «deeple» opp der?

Når fagfolk snakker om kodingen bak kunstig intelligens høres det nesten ut som om de snakker om gåtefulle, levende vesen – som om de har oppdaget en ny art med en atferd som stadig forbauser dem. Slik de for eksempel nylig ble overrasket over at den nevrale oversettingen plutselig leverte svært gode resultater for språkparene kinesisk-spansk. Hvordan programmet oppnådde fremskrittene forble en gåte. At teknologi med så stort potensiale ligger i hendene til et fåtall matematikere som selv ikke helt vet hva skapningene deres driver med, enten de er fra Köln eller California, kan gjøre en stakkar nervøs.

Data er kunstig intelligente maskiners olje

I DeepLs tilfelle er nøkkelen til suksess klar:

– De har fint, tilpasset data.

Josef van Genabith sier ikke det uten misunnelse. Det høres ut som om han snakker om en kaffeprodusent med tilgang til spesielt edle kaffebønner. Men hva gjør programmet med det? Nå snakker Van Genabith om ting som «Matrix-multiplikasjon» og «mangelinjær algebra», eller om at «ord sorteres i mapper i høydimensjonale vektorrom». Okay!

Da kommer man kun videre ved å bruke metaforer.

– Data er kunstig intelligente maskiners olje, sier van Genabith. – Et barn må først lære seg at det må løfte føttene for ikke å snuble når det spaserer i skogen. Hos voksne foregår denne tankegangen automatisk i bakgrunnen siden hjernen har lært hvor man må plante føttene. På lignende vis kan nevrale dataprogrammer løpende lære seg å bygge videre på lærte regler og dermed utvide kunnskapen sin.

Men også Google og Microsoft gjør fremskritt, og selv Amazon tilbyr en nevral oversetter gjennom sitt Cloud-Computing-tjeneste Amazon Web. DeepLs forsprang vil ikke nødvendigvis vare lenge. Eller så blir folkene fra Köln enkelt og greit kjøpt opp.

– Har dere allerede fått et tilbud fra Google, herr Kutylowski?

Han sier at han ikke vil si noe om det. Firmaet vil først tjene penger på premiumversjonen DeepL Pro, som de nylig lanserte. Den vil kunne programmere etter kundenes behov. De har tallrike forespørsler fra store bedrifter, forteller Kutylowski.

Hva med menneskene?

Foto Andrew Wakeman – amerikaner som gjør det bra som oversetter i Tyskland. Enn så lenge. (Foto: LinkedIn)

Hva betyr dette for Andrew Wakeman?

– Jeg bekymrer meg ikke for jobben min, sier oversetteren. – Ja, yrket endrer seg, men det forsvinner ikke.

Wakeman ser på maskinell oversetting som et hjelpemiddel heller enn et alternativ. Som et verktøy han allerede kjenner til og har brukt i lang tid. Som de fleste andre i bransjen har Wakeman allerede i årevis brukt datastøttede oversettelsesverktøy i hverdagen.

Til en viss grad blir den mer spennende delen av jobben igjen for mennesket å løse: ut av slitet på setnings- og ordnivå og opp på haugen der man har oversikt over teksten.

– Man blir mer til en kontrollinstans, sier Wakeman.

Kunstig intelligente verktøy oppfører seg litt som overmotiverte unge kollegaer på kontoret. De leverer mye og er vanvittig raske, men de trenger veiledningen til erfarne medarbeidere for å fullføre prosjektet på rett måte. Det ligner på det man hører i erfaringsrapporter fra dataintensive bransjer der kunstig intelligens-assistenter allerede brukes flittig, for eksempel innen finanstjenester-, rettsvitenskap eller medisin.

Det finnes to teorier om oversettelsesbransjens fremtid. En negativ og en positiv, og de gjelder for alle grener hos tjenesteleverandører hvor kunstig intelligens inntar kontorene:

  1. Maskinene kan stadig løse flere oppgaver, de ødelegger markedet og presser mange mennesker ut av bransjen.

  2. Maskinene gjør menneskene mer produktive, som gjør at flere kan ta seg råd til å betale for oversettelser og andre tjenester, og dermed stiger etterspørselen.

Jaroslaw Kutylowski tror selvsagt på den andre teorien. Andrew Wakeman også.

I debatten om automatisering blir likevel en sentral bekymring værende: at maskinene ikke direkte fjerner arbeidsplasser, men legger et sterkt press på lønningene i hele bransjen. Ta taxibransjen. Taxisjåfører måte tidligere lære seg hele bykart utenat. I dag må de bare finne gass- og bremsepedalen. I fremtiden sitter de kanskje bare som kontrollører i en selvkjørende bil eller bak en monitor i et kontrollsenter. Oppgavene blir enklere, kravene til menneskene mindre, og det blir verdien av arbeidet deres også.

The tasks become simpler, the demands on people lower, the value of their work too.

Andrew Wakeman vurderer av og til om han skal prøve seg på litterære oversettelser, på romaner, på språk som kunstform.

– Det er en drøm jeg har hatt lenge, sier han.

Det hadde også vært å flykte til et sted hvor maskinene ikke kan forfølge ham. Ikke ennå i alle fall.

© 2018 Der Spiegel or Spiegel Online. Distributed by New York Times Syndicate. Oversatt fra tysk av Håkon Benedikt Harnes.

SPIEGEL+DP

Som en del av Dagens Perspektivs europadekning publiserer vi etter avtale jevnlig stoff fra det tyske magasinet Der Spiegel.


Powered by Labrador CMS