UneDose | Glem Siri 4 måder, din telefon er ved at blive smartere på

Joseph Goodman
0
4931
876

Reklame

Alle tre af de store telefonplatforme har nu deres egen stemme. Apple har Siri, Microsoft har Cortana, og Google har den noget mindre sassy Google Now 6 Google Now-funktioner, der ændrer, hvordan du søger 6 Google Nu-funktioner, der vil ændre, hvordan du søger Du bruger muligvis allerede Google Now på din Android-enhed, men får du alt det, du kan ud af det? At vide om disse små funktioner kan gøre en stor forskel. .

Disse systemer giver dig mulighed for at håndtere grundlæggende opgaver gennem stemmestyring. Hver er en slags virtuel sekretær, der kan besvare enkle spørgsmål, åbne apps, lave noter og videresende beskeder. De er nyttige, men de er også frustrerende begrænset. De kan ikke gøre noget, de ikke var eksplicit programmeret til, og mange opgaver er simpelthen ud over deres evner.

Der er dog en række teknologier, der udvikles, der dramatisk forbedrer disse systemer - og de kommer til at være kommercielt tilgængelige i løbet af få år. Her er de fem bedste måder, din telefon er ved at blive meget smartere på.

Det ser hvad du ser

Talegenkendelse har gjort store fremskridt i de sidste fem år takket være udviklingen af kraftfulde neurale netværk. Moderne smartphones kan identificere tale med overraskende nøjagtighed (det er et stykke tid siden Google Now har misforstået mig), og kan endda gøre ting som at identificere sange og tv-shows baseret på deres lyd.

Dette er fantastisk - men det er kun starten. Mennesker interagerer ikke med verden primært gennem lyd. Vi bruger vision til praktisk talt alt - og snart vil vores maskiner også. Vi begynder at se debuten af de første bærbare headsetskærme som Google Glass og Microsofts HoloLens Microsoft viser nye HoloLens-demonstrationer på Build Conference Microsoft viser off nye HoloLens Demos på Build Conference Microsoft's kommende HoloLens headset er det første high-end augmented reality enhed, der er vist for offentligheden. Er det stadig en fantasisk gizmo eller en teknologi, der er ved at realisere sig? , som kan streame information fra deres kameraer til din smartphone, hvilket giver et rig og altid tilstrækkeligt udbud af visuel information. Mange observatører, selv inkluderet, forventer, at disse bliver almindelige i løbet af de næste fem år eller deromkring.

Så hvad kan din telefon gøre med alle disse data?

Masser. Google har allerede demonstreret med deres Tango-tablet Google ønsker at lægge et 3D-kamera på din smartphone - Her er grunden til, at Google vil lægge et 3D-kamera på din smartphone - Her er grunden til, at Googles projekt Tango bringer 3d-sensorer til mobile enheder. Her er hvad vi ved indtil videre. at et dybdekamera kan bestemme den fysiske objekts rumlige placering med ekstrem høj nøjagtighed. Ligeledes har der været nogle fantastiske fremskridt inden for maskinsyn - som Microsofts neurale netværk, der kan identificere individuelle hunderacer, og Googles neurale netværk, der nøjagtigt kan beskrive indholdet af fotografier. Sammen åbner disse teknologier en hel verden af applikationer:

Hvad er denne bolt? Maskinvisionsalgoritmen kender og kan bestille en udskiftning på Amazon på fem sekunder. Hvad var navnet på den kvinde, du mødte i baren i går aftes? Du har måske mistet sit kort, men dine briller fangede hendes ansigt og kan finde hende på Facebook. Du har en underlig muldvarp. Skal du se din læge? Din telefon kan se og fortælle dig det. Du købmand: hvad har du brug for? Dine briller husker sidste gang, du kiggede i dit køleskab, og ved hvad der mangler. De kan endda give dig en gang-for-gang-vejledning for at finde de enkelte emner.

Denne teknologis personlige konsekvenser er skræmmende, men denne slags ting lyder også utroligt nyttigt.

Det ved hvad du kan lide

Smag kan være en vanskelig ting at fastlægge. Det er meget personligt og kan være meget vilkårligt. Spotify og Netflix slutter ved at komme med anbefalinger baseret på brugsmønstre (en teknik, der totalt ignorerer indhold) - men der er reelle grænser for denne tilgang.

Fremtiden ligger i algoritmer, der kan forstå kunsten på et dybt niveau - komplekse neurale netværk, der kan lære at vælge komplekse subtiliteter af musik og film. Det giver en meget rigere forståelse af, hvad folk gør og ikke kan lide ved et stykke medie - et konkret greb om deres smag.

De første tidlige tip af dette begynder at dukke op. Ligesom Spotify's “Oplev ugentlig” playliste, der bruger disse slags indholdsanalyseværktøjer til at anbefale sange - inklusive sange, som du måske ikke normalt hører, fordi de er for uklare til at rangere godt baseret på brugsmønstre. Disse teknikker vil kun blive mere magtfulde i fremtiden, og smarttelefonen er en fantastisk platform til at udnytte disse oplysninger.

Leder du efter noget at gøre med venner? Hvad hvis apps på dine telefoner kan samarbejde, samle oplysninger om din respektive smag og vælge en film eller koncert, som de alle synes om? Hvad med datingsider, der rangerer dig baseret på dybe træk i din respektive smag? Hvad med apps, der kan anbefale dig bøger, fordi de har læst dem?

Mulighederne er uendelige, og nogen vil tjene en masse penge med disse.

Det bliver snakket

Human: hvor er du nu?
Maskine: Jeg er midt i intetsteds.
Human: hvad er formålet med at dø?
Maskine: at have et liv.
Human: hvad er formålet med at være intelligent?
Maskine: at finde ud af, hvad det er.
Human: hvad er formålet med følelser?
Maskine: jeg ved ikke.

Dette er en samtale med et neuralt netværk udviklet af Google, som lærer fra store databaser med tekst uden menneskelig tilsyn. Denne version af den blev trænet på et antal gamle filmscripts og trænet til at forudsige den næste sætning i hver samtale, den mødte. Det viser sig, at hvis du træner en AI på filmmanuskripter, er alle dens samtaler super dramatisk.

Hvis du ikke er imponeret, er det forståeligt. Chatbots har eksisteret i lang tid Sådan opretter du en chatbot til dit websted eller virksomhed Sådan opretter du en chatbot til dit websted eller din virksomhed Problemer med at oprette forbindelse til så mange mennesker overalt i verden er tidszoner. Du ønsker måske at være tilgængelig for at interagere med dit læserskare eller for at gøre forretninger med potentielle kunder, men på nogle ... .

Men kig nærmere på. Googles system er specielt på to vigtige måder.

For det første er det meget simpelt med hensyn til arkitektur: det er et enkelt stort neuralt netværk, og det måtte lære dynamikken i det menneskelige sprog af sig selv. Almindelige chatbots fungerer ved at bruge tusinder af håndkodede regler til, hvordan man reagerer på forskellige situationer. Når de reciterer et svar, er det fordi det blev håndkodet eller husket fra et specifikt eksempel. Googles netværk er anderledes. Det lærte sin opførsel organisk ved at prøve at forstå den dybe struktur i menneskelig skrivning.

For det andet fanger det nogle overraskende subtile dynamikker, som andre chat-bots ikke gør. Det kan besvare spørgsmål om sund fornuft om verden, selvom den ikke eksplicit er programmeret til at gøre det.

Human: der er skywalker ?
Maskine: han er en helt .
Human: hvem er bill Clinton ?
Maskine: han er en milliardær .
Human: er himmelblåt eller sort ?
Maskine: blå .
Human: har en kat en hale ?
Maskine: Ja .
Human: har en kat en vinge ?
Maskine: ingen
Human: kan en kat flyve ?
Maskine: ingen .
Human: hvor mange ben har en kat ?
Maskine: fire, tror jeg .

En anden version af chatboten, der er trænet i logbøger med teknisk support, kan blandes sammen med at give ægte teknisk support overraskende godt. Der er snuble (det ser ud til at have svært ved at huske, hvilket operativsystem du bruger) - men jeg har bestemt fået værre teknisk support fra faktiske mennesker.

Alt dette er en god indikation af, at vi begynder at komme til det punkt, hvor kunstig intelligens virkelig kan være samtale. Netværket ovenfor kan føre en acceptabel samtale, selvom dens træningsmål kun kræver, at den følger den overfladiske struktur i en frem og tilbage dialog.

Givet bedre træningsdata og en belønningsfunktion, der understreger udveksling af oplysninger, er mulighederne ubegrænsede. Forestil dig en version af Siri, der kan engagere dig i en reel samtale, give svar og rådgivning som svar på spørgsmål og udføre opgaver uden at skulle være specifikt programmeret til at gøre det. Det er ikke langt væk.

Det læses godt

En anden teknologi, som Google har arbejdet med, har at gøre med læseforståelse. Det hedder “Tankevektorer,” og konceptet er overraskende enkelt. Du kan udtrække “tankevektorer” fra aktiviteten i et neuralt netværk, der har et stykke information, som en sætning eller en artikel. Hvad du får er et uigennemsigtigt stykke information, der ikke betyder noget for nogen undtagen det netværk, der genererede det. Dette stykke information gemmer i en eller anden forstand “betyder” af teksten, adskilt fra, hvordan den oprindeligt blev formuleret.

Dette har nogle nyttige egenskaber. Til at begynde med ligner disse vektorer hinanden for sætninger med lignende betydning. Hvis du fordøjer to sætninger på denne måde, kan du bestemme, om de betyder den samme ting eller ej. Du kan også manipulere dem. Ved at bruge to neurale netværk til at generere “tankevektorer” fra tekst på forskellige sprog og derefter træne et tredje netværk til at lære at kortlægge dem imellem, kan du oprette en ekstremt kraftfuld maskineoversættelsesmetode, der fanger betydningen af teksten, og ikke kun ordene i den.

En anden potentiel anvendelse af dette er at bruge denne teknologi til at indsamle store mængder information og fordøje den til en kompakt repræsentation og derefter generere et resume baseret på output. Dette kan være enormt kraftfuldt til mobile applikationer.

Forestil dig at være i stand til at bede din telefon om at læse alt tilgængeligt på Google om et givet emne. Så kom tilbage til dig og rapporter kort om dens fund på naturligt sprog og besvar spørgsmål om resultaterne. Dette vil blive virkelighed virkelig, virkelig snart, og det vil være utroligt nyttigt.

Fremtidens telefon

Telefoner i fremtiden vil sandsynligvis se meget anderledes ud end telefoner i dag. De kan være buede. De kan være modulære. Du kan interagere med dem ved hjælp af augmented reality-briller. Den vigtigste forskel vil imidlertid være intelligens. Funktionerne beskrevet her vil omdanne vores enheder til magtfulde vejledere og hjælpere.

Der er i øjeblikket et opvarmet våbenløb Microsoft vs Google - Hvem leder det kunstige intelligens race? Microsoft vs Google - Hvem fører lederen af kunstig intelligens? Kunstige intelligensforskere gør konkrete fremskridt, og folk begynder at tale alvorligt om AI igen. De to titaner, der fører det race af kunstig intelligens, er Google og Microsoft. i dyb læringsteknologi. Bivirkningen er, at disse teknikker skrider frem utroligt hurtigt, og de vil være på markedet før end du måske tror.

Er du begejstret for smartere smartphones? Bekymret for personlige følger? Fortæl os det i kommentarerne!

Billedkreditter: Menneskelig hjerne af Mopic via Shutterstock