Hvordan robotter lærer at læse og tænke

  • William Charles
  • 0
  • 2806
  • 786
Reklame

Vi taler hele tiden om, at computere forstår os. Vi siger Google “vidste” hvad vi søgte efter, eller at Cortana “fik” hvad vi sagde, men “forståelse” er et meget vanskeligt koncept. Især når det kommer til computere.

Et felt inden for computervingvistik, kaldet naturlig sprogbehandling (NLP) arbejder på dette særdeles hårde problem. Det er et fascinerende felt lige nu, og når du først har en idé om, hvordan det fungerer, vil du begynde at se dens virkninger overalt.

En hurtig note: Denne artikel har et par eksempler på, at en computer reagerer på tale, som når du beder Siri om noget. Transformationen af ​​hørbar tale til et computerforståeligt format kaldes talegenkendelse. NLP er ikke bekymret over det (i det mindste i den egenskab, vi diskuterer her). NLP kommer kun i spil, når teksten er klar. Begge processer er nødvendige for mange applikationer, men de er to meget forskellige problemer.

Definition af forståelse

Inden vi går ind på, hvordan computere håndterer naturligt sprog, er vi nødt til at definere et par ting.

Først og fremmest er vi nødt til at definere naturligt sprog. Dette er let: hvert sprog, der regelmæssigt bruges af mennesker, falder i denne kategori. Det inkluderer ikke ting som konstruerede sprog (Klingon, esperanto) eller computerprogrammeringssprog. Du bruger naturligt sprog, når du taler med dine venner. Du bruger sandsynligvis også den til at tale med din digitale personlige assistent.

Så hvad mener vi, når vi siger forståelse? Det er komplekst. Hvad betyder det at forstå en sætning? Måske vil du sige, at det betyder, at du nu har det tilsigtede indhold af beskeden i din hjerne. At forstå et koncept kan betyde, at du kan anvende dette koncept på andre tanker.

Ordbordsdefinitioner er tåbelige. Der er ikke noget intuitivt svar. Filosofer har kranglet om ting som dette i århundreder.

Til vores formål vil vi sige, at forståelse er evnen til nøjagtigt at udtrække mening fra det naturlige sprog. For at en computer skal forstå, er det nødt til nøjagtigt at behandle en indgående strøm af tale, konvertere denne strøm til meningsenheder og være i stand til at svare på input med noget, der er nyttigt.

Dette er klart alt sammen meget vagt. Men det er det bedste, vi kan gøre med begrænset plads (og uden en neurofilosofi-grad). Hvis en computer kan tilbyde et menneskelignende eller i det mindste nyttigt svar på en strøm af naturligt sproginput, kan vi sige, at den forstår. Dette er den definition, vi vil bruge fremover.

Et komplekst problem

Naturligt sprog er meget vanskeligt for en computer at håndtere. Du siger måske, “Siri, giv mig vejledning til Punch Pizza,” hvorimod jeg måske siger, “Siri, Punch Pizza rute, tak.”

I din erklæring kan Siri muligvis vælge nøglefrasen “giv mig retninger,” kør derefter en kommando relateret til søgeudtrykket “Punch Pizza.” I min er Siri imidlertid nødt til at plukke ud “rute” som nøgleordet og ved det “Punch Pizza” er, hvor jeg vil hen, ikke “Vær venlig.” Og det er bare et forenklet eksempel.

Tænk på en kunstig intelligens, der læser e-mails og beslutter, om de måske er svindel eller ej. Eller en, der overvåger stillinger på sociale medier for at måle interessen for et bestemt firma. Jeg arbejdede engang på et projekt, hvor vi var nødt til at lære en computer at læse medicinske noter (som har alle mulige mærkelige konventioner) og indhente information fra dem.

Dette betyder, at systemet måtte være i stand til at håndtere forkortelser, mærkelig syntaks, lejlighedsvis stavefejl og en lang række andre forskelle i noterne. Det er en meget kompleks opgave, der kan være vanskelig, selv for erfarne mennesker, langt mindre maskiner.

Indstilling af et eksempel

I dette særlige projekt var jeg en del af teamet, der lærte computeren at genkende specifikke ord og forholdet mellem ord. Det første trin i processen var at vise computeren de oplysninger, som hver note indeholdt, så vi kommenterede noterne.

Der var et stort antal forskellige kategorier af enheder og relationer. Tag sætningen “Ms Green's hovedpine blev behandlet med ibuprofen,” for eksempel. Fru Green blev tagget som en PERSON, hovedpine blev tagget som SIGN ELLER SYMPTOM, ibuprofen blev tagget som MEDICATION. Derefter blev fru Green knyttet til hovedpine med et PRÆSENTS-forhold. Endelig blev ibuprofen knyttet til hovedpine med en TREATS-relation.

Vi mærkede tusinder af noter på denne måde. Vi kodede diagnoser, behandlinger, symptomer, underliggende årsager, co-morbiditeter, doseringer og alt andet, du muligvis kunne tænke på relateret til medicin. Andre annotationsteam kodede anden information, f.eks. Syntaks. I sidste ende havde vi et korpus fuld af medicinske bemærkninger om, at AI kunne “Læs.”

Læsning er lige så svært at definere som forståelse. Computeren kan let se, at ibuprofen behandler en hovedpine, men når den lærer disse oplysninger, omdannes den til meningsløse (for os) dem og nuller. Det kan helt sikkert give tilbage information, der forekommer menneskelig og er nyttig, men udgør det forståelse. Hvad kunstig intelligens ikke er, hvad kunstig intelligens ikke er. Vil intelligente, oplagte robotter overtage verden? Ikke i dag - og måske ikke nogensinde. ? Igen er det stort set et filosofisk spørgsmål.

Den virkelige læring

På dette tidspunkt gik computeren gennem noterne og anvendte en række maskinlæringsalgoritmer. 4 Maskinlæringsalgoritmer, der former dit liv. 4 Maskinlæringsalgoritmer, der former dit liv. Du er måske ikke klar over det, men maskinlæring er allerede rundt omkring dig, og det kan udøve en overraskende grad af indflydelse over dit liv. Tro mig ikke? Du bliver måske overrasket. . Programmerere udviklede forskellige rutiner til at mærke dele af talen, analysere afhængigheder og valgkredse og mærke semantiske roller. I det væsentlige lærte AI at “Læs” noterne.

Forskere kunne til sidst teste det ved at give det en medicinsk note og bede den om at mærke hver enhed og forhold. Når computeren nøjagtigt gengav menneskelige kommentarer, kunne du sige, at den lærte at læse de nævnte medicinske noter.

Derefter var det bare et spørgsmål om at samle en enorm mængde statistik om, hvad den havde læst: hvilke lægemidler der bruges til at behandle hvilke lidelser, hvilke behandlinger der er mest effektive, de underliggende årsager til specifikke symptomssæt osv. Ved afslutningen af ​​processen ville AI være i stand til at besvare medicinske spørgsmål baseret på bevis fra faktiske medicinske noter. Det behøver ikke at stole på lærebøger, farmaceutiske virksomheder eller intuition.

Deep Learning

Lad os se på et andet eksempel. Googles neurale DeepMind-netværk lærer at læse nyhedsartikler. Ligesom den biomedicinske AI ovenfor, ønskede forskere, at den skulle hente relevant og nyttig information fra større tekststykker.

Det var hårdt nok at træne en AI i medicinsk information, så du kan forestille dig, hvor meget kommenterede data du har brug for for at en AI kunne læse generelle nyhedsartikler. At ansætte nok kommentarer og gennemgå nok information ville være uoverkommeligt dyrt og tidskrævende.

Så DeepMind-teamet henvendte sig til en anden kilde: nyhedswebsteder. Specifikt CNN og Daily Mail.

Hvorfor disse websteder? Fordi de leverer kuglepunkter af deres artikler, der ikke blot trækker sætninger fra selve artiklen. Det betyder, at AI har noget at lære af. Forskere fortalte dybest set AI, “Her er en artikel, og her er de vigtigste oplysninger.” Derefter bad de det om at trække den samme type information fra en artikel uden markerede højdepunkter.

Dette kompleksitetsniveau kan håndteres af et dybt neuralt netværk, som er en særlig kompliceret type maskinindlæringssystem. (DeepMind-teamet laver nogle fantastiske ting på dette projekt. For at få detaljerne, se denne fantastiske oversigt fra MIT Technology Review.)

Hvad kan en læse-AI gøre?

Vi har nu en generel forståelse af, hvordan computere lærer at læse. Du tager en enorm mængde tekst, fortæller computeren, hvad der er vigtigt, og anvender nogle maskinlæringsalgoritmer. Men hvad kan vi gøre med en AI, der henter information fra teksten?

Vi ved allerede, at du kan hente specifikke handlingsmæssige oplysninger fra medicinske noter og sammenfatte generelle nyhedsartikler. Der er et open source-program kaldet P.A.N. der analyserer poesi ved at trække temaer og billeder. Forskere bruger ofte maskinlæring til at analysere store organer af sociale mediedata, som bruges af virksomheder til at forstå brugernes følelser, se, hvad folk taler om, og finde nyttige mønstre til markedsføring.

Forskere har brugt maskinlæring for at få indsigt i e-mail-adfærd og virkningerne af e-mail-overbelastning. E-mail-udbydere kan bruge det til at filtrere spam fra din indbakke og klassificere nogle meddelelser som høj prioritet. Læsning af AI'er er kritiske for at gøre effektive kundeservicechatbots 8 Bots, du skal tilføje til din Facebook Messenger-app 8 Bots, du skal tilføje til din Facebook Messenger-app Facebook Messenger har åbnet op for chatbots, så virksomheder kan levere kundeservice, nyheder og mere direkte til dig via appen. Her er nogle af de bedste tilgængelige. . Overalt hvor der er tekst, er der en forsker, der arbejder med naturlig sprogbehandling.

Og når denne type maskinlæring forbedres, øges mulighederne kun. Computere er bedre end mennesker i skak, Go og videospil nu. Snart er de måske bedre til at læse og lære. Er dette det første skridt mod stærk AI. Her er grunden til, at forskere mener, at du skal være bekymret for kunstig intelligens. Her er, hvorfor videnskabsmænd synes, du skal være bekymret for kunstig intelligens. Synes du, at kunstig intelligens er farlig? Kan AI udgøre en alvorlig risiko for den menneskelige race. Dette er nogle af grundene til, at du måske vil være bekymret. ? Vi bliver nødt til at vente og se, men det kan være.

Hvilke anvendelser ser du til en tekstlæsning og læring AI? Hvilke slags maskinlæring tror du, vi ser i den nærmeste fremtid? Del dine tanker i kommentarerne herunder!

Billedkreditter: Vasilyev Alexandr / Shutterstock




Endnu ingen kommentarer

Om moderne teknologi, enkel og overkommelig.
Din guide i en verden af moderne teknologi. Lær hvordan du bruger de teknologier og gadgets, der omgiver os hver dag, og lær, hvordan du finder interessante ting på Internettet.