UneDose | YouTube vil bruge neurale netværk til faktisk at forstå videoer

William Charles
0
2895
92

Søgning på YouTube Sådan søger du på YouTube som en PRO med Google Advanced Operators Hvordan man søger på YouTube som en PRO med Google Advanced Operators kan være en frustrerende oplevelse; hvis du ved, hvad en video handler om, eller du husker indholdet, men ikke navnet, kan du søge i meget lang tid. Det er fordi YouTube faktisk ikke gør det se videoerne, som en person gør. Den ser bare metadata - titel, beskrivelse og tags. Og det antages, at uploaderen gider at inkludere oplysningerne.

Alt dette kunne ændre sig i den nærmeste fremtid. Google indgav for nylig et patent, der angiver, at YouTube muligvis faktisk begynder at forstå de videoer, den spiller.

Relevansbaseret billedvalg

Googles patentansøgning er til “relevansbaseret billedvalg,” en fancy måde at sige “finde de ting, som nogen søgte efter, baseret på hvad der er i en video.” I det system, der er udarbejdet i patentet, trænes en algoritme til at udtrække specifikke funktioner i hver video og tildele nøgleord til dem - den kan derefter returnere en video som svar på en brugerinitieret søgning, der inkluderer disse nøgleord.

Applikationen giver et interessant eksempel:

“[I] hvis brugeren indtaster søgeforespørgslen “bil race,” videosøgemaskinen ... kan finde og returnere en billædescene fra en film, selvom scenen muligvis kun er en kort del af filmen, der ikke er beskrevet i de tekstmæssige metadata.”

Dette vil naturligvis drastisk ændre, hvor effektiv en YouTube-søgning er. Videoer, der tidligere har været ufindbar på grund af dårlige metadata, findes. Videoer, der indeholder nyttige klip i midten, omgivet af mindre interessante ting i begyndelsen og slutningen, vil være meget mere værdifulde. TED-samtalevideoer 8 TED-samtaler Videoer under 5 minutter, du vil se 8 TED-tales videoer under 5 minutter, længe du vil se Har du fem minutter på at dræbe? Hvilken bedre måde at bruge den tid på end at se en fascinerende eller informativ TED Talks-video. Der er meget godt indhold tilgængeligt at se på TED, men nogle gange ... kan det findes på baggrund af enkeltlinjer, der er talt i dem. Du kan også finde kattevideoer, selvom “kat” er ikke i titlen.

Ved at kombinere denne teknologi med Googles allerede imponerende evne til at finde ting, der er relateret til dine søgetermer, betyder det sandsynligvis, at det at finde videoer bliver en helt anden oplevelse. Du kan se relaterede videoer, der ikke inkluderer dit søgeudtryk, men inkluderer et udtryk, der er relateret (måske endda visuelt relateret). Det visuelle ækvivalent af placering af søgeord kan muligvis begynde at påvirke, hvor en video vises i placeringerne. Hvem ved, hvor avanceret dette kunne være?

Hvordan virker det?

Google holder forståeligt nok deres kort tæt på deres bryst på denne. Følgende afsnit i deres patentansøgning kaster imidlertid lys over, hvordan de får YouTube til “se” videoer:

“I et aspekt genererer et computersystem det søgbare videoindeks ved hjælp af en maskinlært model 4 Machine Learning Algorithms That Shape Your Life 4 Machine Learning Algorithms That Shape Your Life Du er måske ikke klar over det, men maskinlæring er allerede rundt omkring dig, og det kan udøve en overraskende grad af indflydelse på dit liv. Tro mig ikke? Du bliver måske overrasket. af forholdet mellem funktioner i videorammer og nøgleord, der er beskrivende for videoindhold. Videohostesystemet modtager et mærket træningsdatasæt, der inkluderer et sæt medieelementer (f.eks. Billeder eller lydklip) sammen med et eller flere nøgleord, der beskriver indholdet af medieelementerne. Videohostesystemet udtrækker funktioner, der karakteriserer indholdet af medieelementerne. En maskinlært model er trænet til at lære sammenhænge mellem bestemte funktioner og nøgleordene, der er beskrivende for indholdet. Videoindekset genereres derefter, der kortlægger rammer af videoer i en videodatabase til nøgleord baseret på funktionerne i videoerne og den maskinlærede model.”

Det er meget rigtigt tæt, men her kommer det ned. Der oprettes en maskinlæringsalgoritme, og for at hjælpe den med at lære, vil Google vise den en masse videoer og give nøgleord til at fortælle den, hvad der er i videoen. Algoritmen begynder at lære at knytte bestemte funktioner i videoerne til specifikke nøgleord og gives feedback fra Googles ingeniører. Jo flere videoer og nøgleord det bliver vist, jo bedre bliver det ved processen.

Til sidst introduceres algoritmen i YouTube-søgemaskinen, hvor den fortsætter med at lære og bliver bedre til at vælge relevante søgeord fra lyd- og videoindhold. Mens patentansøgningen ikke specifikt nævner neurale netværk Den nyeste computerteknologi, du er nødt til at se for at tro Den nyeste computerteknologi, du er nødt til at se for at tro, tjek nogle af de nyeste computerteknologier, der er indstillet til at omdanne verden af elektronik og pc'er i løbet af de næste par år. , er det meget sandsynligt, at denne særlige type maskinlæring vil blive brugt, da det er meget godt til iscenesat læring som denne.

Ved at simulere den menneskelige hjerne (eller i det mindste en teoretisk model for, hvordan den lærer), kan store neurale netværk blive meget effektive til at lære på egen hånd uden opsyn, og YouTube ville give en absolut gigantisk legeplads, hvor den kunne lære og modtage feedback . Andre typer maskinindlæring kunne bruges, men ud fra det, vi ved i øjeblikket, ser neurale netværk bestemt det mest sandsynlige ud.

Google-forsker (og “far til dyb læring”) Geoffrey Hinton antydede noget om denne virkning i sin Reddit AMA tidligere på året.

“Jeg tror, at de mest spændende områder i løbet af de næste fem år virkelig vil være at forstå videoer og tekst. Jeg vil blive skuffet, hvis vi om fem år ikke har noget, der kan se en YouTube-video og fortælle en historie om, hvad der skete.”

Vil det skabe opmærksomhed og dræbe os alle?

Dette er altid det spørgsmål, der dukker op, når en ny meddelelse om maskinlæring rammer nyhederne. Og svaret er, som altid, ja. Her er grunden til, at forskere mener, at du skal være bekymret for kunstig intelligens. Her er grunden til, at forskere mener, at du skal være bekymret for kunstig intelligens. Synes du, at kunstig intelligens er farlig? Kan AI udgøre en alvorlig risiko for den menneskelige race. Dette er nogle af grundene til, at du måske vil være bekymret. . YouTube vil samarbejde med Watson og Wolfram Alpha for at narre os til underdanighed ved hjælp af YouTube-videoer, hvorefter de sandsynligvis vil forvandle os til computermad. (Har du ikke set det Colossus?)

Jeg spøg selvfølgelig. Men de potentielle implikationer af at træne computere til at genkende ting, som de “se” og “høre” i videoer er meget imponerende. DARPA er allerede begyndt at se dig vil ikke tro det: DARPA Fremtidsforskning i avancerede computere Du vil ikke tro det: DARPA Fremtidsforskning i avancerede computere DARPA er en af de mest fascinerende og hemmelighedsfulde dele af den amerikanske regering. Følgende er nogle af DARPAs mest avancerede projekter, der lover at omdanne verden af teknologi. på sikkerhedsmæssige implikationer af denne teknologi, men det er ikke svært at forestille sig, at den bruges i lovgivning, hjemmesikkerhed, uddannelse ... stort set overalt.

Hvorvidt Googles relevansbaserede billedvalg vil være så effektiv, som vi forestiller os, gjenstår at se, men dette kan være en potentielt banebrydende ændring i videosøgning. Og derfra, hvem ved det? Hvis Google kan bruge sandheden som en rangerende faktor, kan Google bruge en algoritme til at bestemme sandheden? Kan Google bruge en algoritme til at bestemme sandheden? Google undersøger, om dens algoritme kan omfatte sandhed som en rangeringsfaktor. Hvad betyder det for nettet? , er der ingen grund til at tro, at denne teknologi ikke vil være utroligt kraftig. Det kan ændre, hvor meget af Internettet, der virkelig forstår sig selv. Hvis den tanke ikke binder dit sind i knuder, ved jeg ikke, hvad det vil.

Hvad synes du om Googles patentsøgning? Hvilke andre anvendelser kan du forestille dig, at denne teknologi har? Del dine tanker nedenfor!

Billedkreditter: Willyam Bradberry via Shutterstock.com, Ciumac Sergiu via Code42, Marko Bradic via Shutterstock.com.