Belangrijkste leerpunten
- Google heeft een nieuwe tool gelanceerd waarmee gebruikers naar nummers kunnen zoeken door te neuriën, zingen of fluiten.
- De nieuwe tool maakt gebruik van machine learning om een neuriënd nummer te matchen met een database van meer dan een half miljoen nummers die voortdurend wordt bijgewerkt.
- Google-gebruikers vragen welk nummer bijna 100 keer per maand wordt afgespeeld.
Google heeft een nieuwe functie gelanceerd genaamd “Hum to Search” om een frustrerend probleem op te lossen: een nummer in je hoofd hebben en niet kunnen achterhalen hoe het heet. Het idee om te neuriën om een nummer te vinden lijkt ongelooflijk eenvoudig, dus waarom lanceert Google deze functie pas in 2020? Nou, het blijkt dat het identificeren van nummers op deze manier eigenlijk behoorlijk ingewikkeld is, deels omdat onze geneuriede versies nogal verschillen van het originele nummer. In een recent bericht op zijn AI-blog legt Google uit hoe het machine learning heeft gebruikt om dit probleem op te lossen en uiteindelijk mensen te helpen een nummer te vinden door de melodie te neuriën, fluiten of zingen, zelfs als hun weergave minder dan nauwkeurig is. “Onze focus voor Hum to Search ligt op het helpen van mensen bij het identificeren en vinden van muziek die in hun hoofd blijft hangen”, zegt een Google-woordvoerder. reddingsdraad in een e-mail.
Begin gewoon te neuriën
Google-gebruikers vragen welk nummer bijna 100 miljoen keer per maand wordt afgespeeld, zegt Aparna Chennapragada, vice-president en algemeen directeur consumentenwinkelen van Google, in een video waarin verschillende nieuwe zoekfuncties worden geïntroduceerd. Nu is er een manier om erachter te komen. De functie “Hum to Search” is ingebouwd in de mobiele app van Google, de Google Zoeken-widget en de Google Assistent. Om het via de app te openen, tik je op het microfoonpictogram en zeg je ‘Wat is dit nummer?’ Het selecteren van de knop “Een nummer zoeken” werkt ook. Om correct te werken, moet u voor de functie minimaal 10-15 seconden neuriën. Android-gebruikers kunnen neuriën om nummers in meer dan 20 talen te vinden, terwijl op iPhones alleen Engelse nummers werken. De tool kan een nummer niet altijd meteen identificeren, maar als dat het geval is, zijn de resultaten redelijk goed.
“Meer dan de helft van de nummers van een brede reeks variabelen (toon, toonhoogte, volume, enz.) worden herkend door onze algoritmen, maar de nauwkeurigheid hangt natuurlijk af van de kwaliteit van het neuriën, het type van het nummer en meer , “vertelde de Google-woordvoerder reddingsdraad in een e-mail. “Maar als het eenmaal wordt herkend, zijn ongeveer vier van de vijf antwoorden correct.” Dit is echter niet de eerste keer dat neuriën wordt gebruikt in een app voor het identificeren van muziek. SoundHound biedt een vergelijkbare functie, zoals opgemerkt door CNN Business, en is ook beschikbaar op Android en iOS. Volgens de Google-woordvoerder roept de nieuwe functie geen privacyproblemen op, noch verandert het “de manier waarop Google omgaat met op audio gebaseerde interacties”, zeiden ze. reddingsdraad in een e-mail.
Machinaal leren
Ondanks de eenvoud van het concept, is het technisch vrij moeilijk om een deuntje te neuriën om de studio-opname te vinden. Daar zijn verschillende redenen voor, legt Christian Frank van Google Research uit in een blogpost van 12 november. Allereerst kan een geneuriede versie van het nummer sterk verschillen van de eigenlijke opname, waardoor het moeilijk is om de twee te matchen. Dus hoewel Shazam en een groot aantal andere apps al bestaan om dat nummer te identificeren dat je in een restaurant of een andere openbare plaats hoort, kan het lastiger zijn om een neuriënde melodie als basis voor die zoektocht te gebruiken. “Met teksten, achtergrondzang en instrumenten kan de audio van een musical of studio-opname heel anders zijn dan een neuriënd deuntje”, schrijft Frank. “Per ongeluk of ontwerp, wanneer iemand hun interpretatie van een nummer neuriet, kunnen de toonhoogte, toonsoort, tempo of ritme vaak enigszins of zelfs aanzienlijk variëren.”
Omdat de neuriënde versies van nummers zo kunnen verschillen van de originelen, merkt Frank op dat bij veel methoden uit het verleden het neuriën van een persoon moest worden afgestemd op een versie van het nummer die alleen een melodie heeft, of een nummer dat neuriën bevat. Dit heeft het gebruik in de echte wereld uitdagend gemaakt, omdat de databases met die nummers beperkt kunnen zijn en handmatig moeten worden bijgewerkt. Google legt uit dat het voor de functie Hum to Search machine learning-modellen gebruikt om audio om te zetten in een “op nummers gebaseerde reeks” die de melodie van het nummer vertegenwoordigt – wat het zegt, kan worden gezien als een “vingerafdruk”.
Gebruiksvriendelijker
Het gebruik van machine learning in de functie Hum to Search van Google maakt de tool uiteindelijk een stuk gemakkelijker te gebruiken in de echte wereld. Omdat Hum to Search het neuriënde deuntje van de zoeker afstemt op het eigenlijke nummer, kan de tool met de nieuwe nummers werken wanneer ze worden uitgebracht in plaats van een database die constant moet worden bijgewerkt met neuriënde versies van elk nummer. Bovendien heb je geen perfecte pitch nodig om het te gebruiken. “Het huidige systeem bereikt een hoge mate van nauwkeurigheid in een database met nummers die meer dan een half miljoen nummers bevat die we voortdurend bijwerken”, zei Google in de aankondiging van Hum to Search. “Dit songcorpus heeft nog ruimte om te groeien om meer van ’s werelds vele melodieën op te nemen.”