Naar content
Trending apps
  • Ouderlijk toezicht voor Nintendo Switch

  • Inbox by Gmail

  • Maps: Navigatie en OV

  • WhatsApp Messenger

  • Messenger

Trending games
  • Super Mario Run

  • RollerCoaster Tycoon® Classic

  • Bully: Anniversary Edition

  • Paper Wings

  • Pokémon GO

Trending smartphones
  • Samsung Galaxy Note 9

  • Nokia 8 Sirocco

  • OnePlus 6

  • Xiaomi Mi A1

  • Samsung Galaxy S9+

Nieuwste tablets
  • Samsung Galaxy Tab S3 9.7

  • Asus Zenpad 3S 10

  • Sony Xperia Z4 Tablet

  • ASUS ZenPad S 8

  • ASUS ZenPad 8

Oké, eng en gaaf tegelijk

Kunstmatige intelligentie van Google kan stemmen onderscheiden in een menigte

· 14 april 2018

Google heeft een aantal afdelingen waar gewerkt wordt aan technieken waar we geen weet van hebben. Zo nu en dan komt er iets naar buiten dat ons laat verbazen. Zo kan de kunstmatige intelligentie van Google nu stemmen uit een menigte isoleren en de rest wegfilteren.

Stemmen filteren

De beste techniek op aarde zit in de mens zelf. We kunnen nog steeds dingen die de techniek die we maken niet zelf kunnen, al worden er dat steeds minder. We hebben het vermogen ons te concentreren op een spreker in een drukke omgeving om te horen wat hij of zij zegt. Dat kan een microfoon niet, die neemt alle geluiden op en kan geen onderscheid maken. Dat is nu verleden tijd want de slimme koppen bij Google hebben met behulp van kunstmatige intelligentie een techniek bedacht waarbij ze stemmen van elkaar kunnen isoleren.

In de video hierboven zien we een videogesprek waarbij op de achtergrond iemand zit te bellen. Het is niet dat we de man in de video niet kunnen verstaan of volgen maar de achtergrond is enorm storend. De techniek van Google kan nu de stemmen van beide personen isoleren en deze aan- of uit zetten. Dat zorgt ervoor dat we het onderwerp van het videogesprek, de man, duidelijk kunnen volgen en de dame niet. 

Dat is natuurlijk een prachtige uitvinding want het kost ons nu veel minder energie om het gesprek te volgen. Maar er is ook een 'enge' kant aan deze techniek want wanneer we de man uitzetten en de dame aan dan kunnen we haar gesprek woord voor woord volgen en dat zou een schending van de privacy kunnen zijn. 

Deze techniek is natuurlijk heel erg ingewikkeld en wordt uitgelegd aan de hand van het bovenstaande filmpje en het onderstaande schema.

Schema kunstmatige intelligentie

Als mens volg je de bewegingen van de spreker en matcht daarbij het geluid dat je oren opvangen. De bewegingen van de mond moeten daarbij gelijk zijn aan de woorden of het geluid dat je hoort. Volgens een zelfde systeem werkt de techniek van Google, het scant de gezichten en de beweging van de mond en zoekt daarbij de best passende geluiden. De andere geluiden die daar niet bij passen filtert het systeem weg waarbij alleen de stem overblijft die we willen horen.

Is dit eng?

Elke nieuwe uitvinding heeft zijn donkere kant, ook deze. Het is natuurlijk fantastisch wanneer je het in een conference-call kan gebruiken maar je wil natuurlijk niet dat de overheid een menigte filmt en dan jouw gesprek met iemand eruit kan filteren. 

Bron: Google

Spelfouten, taalfouten of inhoudelijke fouten ontdekt? Stuur dan een mailtje naar de auteur van dit artikel!

Reacties (5)
Bezig met laden van reacties...