DeepMind A.I. Bridges gapet mellom robot og menneskelige stemmer

DeepMind: The Podcast | Episode 4: AI, Robot

Kunstig intelligens bare gjort robot stemmer høres mye mer realistisk ut.

DeepMind, som tidligere demonstrerte kraften til A.I. ved å slå en menneskelig spiller på Go i mars og kutte strømregningen i halvparten i juli, er nå fokusert på talesyntese.

A.I-forskergruppen, som er en del av Googles morselskapsalfabet, avslørte i morges at den har opprettet en ny teknologi som heter WaveNet, som kan brukes til å generere tale, musikk og andre lyder mer nøyaktig enn tidligere.

DeepMind forklarer at mange eksisterende talesyntesemetoder stole på at "en meget stor database med korte talefragmenter er innspilt fra en enkelt høyttaler og deretter rekombinert for å danne fullstendige uttrykk." WaveNet bruker derimot "råbølgeformen til lydsignalet "For å skape mer realistiske stemmer og lyder.

Dette betyr at WaveNet jobber med de individuelle lydene som oppstår når et menneske snakker i stedet for å bruke komplette stavelser eller hele ord. Disse lydene kjøres deretter gjennom en "beregningsfull dyr" prosess som DeepMind har funnet "viktig for å generere komplisert, realistisk lydende lyd" med maskiner.

Resultatet av alt det ekstra arbeidet er en 50 prosent forbedring av syntetisert tale i amerikansk engelsk og kinesisk mandarin. Her er et eksempel på talegenerering ved hjelp av parametrisk tekst-til-tale, som er vanlig i dag, brukt av DeepMind for å demonstrere hvordan denne talesyntesemetoden mangler:

Og her er et eksempel på den samme setningen som er generert av WaveNet:

Som bedrifter fortsetter sitt arbeid med naturlige språkgrensesnitt, vil det bli stadig viktigere å tilby mer realistiske svar. WaveNet kan bidra til å løse dette problemet.

FCC stemmer til Break Cable's Stranglehold på Set-Top Boxes

FCC godkjente i dag med en stemme på tre til to et forslag som vil åpne kabel-set-top-boksindustrien til tredjepartsleverandører og potensielt spare deg for mye penger. Forslaget, kunngjort av FCCs styreformann Tom Wheeler i januar, ville kreve kabelbedrifter å åpne kabelboksens spillefelt: Det ville gi ...

FCC-stemmer for å oppdatere nødvarselsystemet

FCC vil oppdatere maksimal lengde på varslingsmeldinger fra 90 til 360 tegn og kreve 4G LTE-nettverk for å tillate tjenestene i meldingene.

Vitenskap: Hvis du stemmer for Trump, så gjør dine venner

Forfatteren Jonah Berger argumenterer for at du stemmer ved stemmeseddelen er et sosialt signal om hvem du er og en måte å passe inn i bestemte grupper.