0:00:07na přednášce
0:00:10zeroes
0:00:11_e měla by být dneska _e syntéza řeči
0:00:15zem k tomu že se skupiny speech exit se v podstatě jediný kdo to kdy
0:00:19nějak dělal to jako diplomku
0:00:22tak to popadlo na mě
0:00:25takže tam o tom
0:00:27něco se pokusím říct
0:00:29a byl bych rád že pokud byste měli k tomu nějaké dotazy tak _e prostě
0:00:33ptejte stále budete mít
0:00:35nějakou myšlenku
0:00:38a nenechávejte to na potom
0:00:42a ještě dál naše začneme tak _e
0:00:46sloupec jednotky
0:00:48mě řekl že vám tady mám říct
0:00:51co si o nějakým C E mailu který mimo jiné posílal tak máte to tady
0:00:57jo to byl i přečtu
0:00:59po této přednášce budou numericky cvika
0:01:04že předpokládám že to přednášku nebudeme my do šesti že to bude trošku kratší
0:01:08potom
0:01:11_e
0:01:12co si ohledně projektu
0:01:14číslo dva
0:01:16odevzdání ve čtvrtek dvanáctého pátý
0:01:22tak potom
0:01:25termín zkoušky se dobře vidím devátého pátý
0:01:28deset až dvanáct
0:01:31jo místnost tohle asi pro vás důležitým místnost cestu pět
0:01:37a měli byste se dostavit nejpozději devět padesát
0:01:43no
0:01:45a projekt
0:01:47bude opraven během příštího týdne neměli byste spoléhat na to že
0:01:51že
0:01:53dostane se na zkoušku dostatek bodů takže
0:01:56udělat projektu a
0:01:58budete ještě být
0:02:01tak
0:02:03to je všechno _e
0:02:05organizačních záležitostí
0:02:09podíváme se na syntézu
0:02:12takže
0:02:15tady tento kurz se tati asi doteď zabýval spíš _e rozpoznávání to znamená měli ste
0:02:23měli ste řeč _e byste se snažili v podstatě počítačem nějakým způsobem extrahovat informace co
0:02:30v ní sou takže z toho
0:02:32udělat nějaké slovní předpis zjistit kdo tam mluví _e zjistit jakým jazykem mluví a jaké
0:02:37jsou tam klíčový slova já nevím
0:02:39já nevím co všechno
0:02:41a teď se podíváme vlastně na tu opačnou v je toto je vy máte nějakou
0:02:45textovou informaci _e se
0:02:48se test toho udělat jaké ten signál znamená chcete to prostě nějakýmu
0:02:51člověku přehřátá ten člověk by měl mít pocit že to mluví
0:02:56ideálním nějaký jiný člověka ne plechova loop
0:03:02tak _e
0:03:08co se týká
0:03:09vlastně syntézy tak _e
0:03:13to využití
0:03:15může být to si asi každý dokáže představit odpomoci nějakým postiženým lidem který neslyší teda
0:03:22navopak který vidí a slyší
0:03:24takže nemůžou číst ale můžu poslouchá tak že sou schopný prostě ty informace dostat skrze
0:03:29ucho
0:03:31přes nějakou pomoc nesní době každá nějaká navigace má a syntézu takže řídíte a vám
0:03:39to říká right doleva jeďte doprava
0:03:42teče otázka jak moc tomu rozumíte a jak moc té přesný a
0:03:46jestli jako vlastně kdybysme zmaten Š jako že vám to poradit
0:03:51_e potom samozřejmě ideální stav je alla startrek a podobné věci že máte doma prostě
0:03:58něco co taktiku úplně vklidu wheel všechno to jako
0:04:02řekne kdyby
0:04:03ste měli někde
0:04:05krabici zavřený ho člověka vy nepoznáte rozdíl
0:04:09tam
0:04:10se to bude ještě chvilku trvat než se tam my se tam dostaneme
0:04:16to je
0:04:17taky zajímavý je že podstatě syntéza řečí je to _e inter disciplinární věc takže nejenom
0:04:25signál procesing
0:04:26ale máte tam tyto hry informaci máte tam největší _e začalo procesing takže věci co
0:04:31dělá pavel smrž
0:04:33_e fonetiku databázových systémech prostě tam to hromada jo takže se tam bylo zkopírovat soustavy
0:04:41_e se říká historie asi někdy osumnáct set padesát první mechanicky syntetizátor proto jako jakýsi
0:04:49varhany prostě mělo to padá pedály kroky a jakým způsobem
0:04:53se tam simuloval lokální trakt a když ten člověk na to jako by hrál takovou
0:04:58stupňů jako
0:05:00jo tak tomu bylo to schopností za tady nějakou písničku
0:05:04got se indukují
0:05:05_e devatenáct set dvacet dva první nějaký primitivní elektrický _e syntetizátor
0:05:12no a potom jak začali _e počítače ta kuš v podstatě se jednalo o nějaké
0:05:19nějaké prográmky které byly schopny Ú řeči lépe mluvit
0:05:23takle vypadá o ten dnes _e jeden
0:05:27těch _e
0:05:29první vokodérů
0:05:32_e toto myslím že zrovna ten manuální to znamená vy ste měli nějaký zdroj
0:05:38a boj signálu suše šumový generátor avoj signálu
0:05:43nějakej
0:05:45nevím
0:05:46jak to říct
0:05:47říkali tomu
0:05:48nebo prostě něco co nějak učí
0:05:51tak tady máte nějakou rezonanční komoru máte nějaký pedály kterým ovládáte vlastně ten shape ten
0:05:58tvar trhu naší komory a na konci hotels nějakým svoloč
0:06:02no tím nekrytej změníte ty klapky a tadyhle nějakým se dále měníte základní tón
0:06:08tak
0:06:09no to potom zní jako že
0:06:12víte co je základní to
0:06:15jo
0:06:16dobře víte jo jak vypadá prostě hlasové ústrojí co se tam vlastně děje jo co
0:06:21se všechno musí stát třetí mneš
0:06:23to vypadne
0:06:25zkusil vznikl jako řeč
0:06:30zase že zase že
0:06:32_e fajn
0:06:36tak _e
0:06:38takže použití nejednodušší použití jsou nějaký _e telefonní aplikace to znamená help lajny jakou centrála
0:06:46klasické použití a dělá systému plechové úplně kam se dovolat _e citoval říkal značky to
0:06:51jednoznačně tesla
0:06:52obvykle to je všechno namluvení předem jo takže o to ani tak jako té tesco
0:06:56není nebo
0:06:58musí se to považovat za té tesco protože to podstatě někdo namluví jazyce to jenom
0:07:02že ano nafláká se to za sebe jo ale může tam být nějaká elementární logika
0:07:07tam můžou být nějaké inteligentnější S dialogové systémy banka včera to teda moc zatím není
0:07:14že zavoláte _e prostě něco řeknete tam padesátkou který vám to rozpozná do nějakýho textu
0:07:20takže se to zjistit podstatě zkuste řekli poskládat to oslovit se nějak vám to odpoví
0:07:25syntetizuje tu odpověď aby si v podstatě
0:07:28povídáte s počítačem
0:07:31navigační systémy skautech zase relativně jednoduchý té terezko máte nějakou jednoduchou gramatiku X desítek stovek
0:07:38slov a v podstatě vám to jenom nějakým omezeným slovníkem _e říct jestli máte je
0:07:43pro mě nebo doleva
0:07:45_e použitích počítačích
0:07:48někde se vyhrabal že by měl velkou výzvy že dva tisíce čtrnáct bude na nás
0:07:53pí síčko mluvit ami není budeme mluvit no už se to blíží zatím se nezdá
0:07:57takže
0:07:58ještě to bude chvilku pro nicméně google
0:08:02se snaží rodila
0:08:05dělat dost
0:08:07no a
0:08:08budoucnost
0:08:09koukněte se na nějaký fi filmy
0:08:15_e ačkoli se může stát že _e syntéza jednoduchá v podstatě je dost složitá a
0:08:21to z jednoduchýho důvodu nebo pokud chcete mít hodně to budou syntézu
0:08:26_e když si poslechnete nějak jakýkoli systém a on vám tam udělá nějakou chybu tak
0:08:30si tu chybu prostě slyšíte to jako člověk
0:08:33je tam něco jinak co vám nesedí
0:08:35obvykle sou to takové věci které sou dost blbě pochopitelně jako je prozódie
0:08:41to znamená
0:08:42_e _m
0:08:43ten počítač době klesne hlasem jo dá blbě při dá prostě něco takovýho
0:08:49a václav to prostě tahá za užšího jevy to posloucháte a teď prostě to tam
0:08:53jako
0:08:54kladivem mlátila sto do hlavy jako že
0:08:57to není vono
0:08:58a pokud Š
0:09:00eště k tomu ten hlas
0:09:02zní jako opravdu blbě jako opravdu taková oba tak _e vám to začne dávat strašnou
0:09:07námahu abyste tomu vůbec rozměry abyste jako s toho něco měli tudíž přestává to mít
0:09:12ten člověk odjíždíte a vy se musíte soustředit na to co vám vlastně ta navigace
0:09:16řekla
0:09:17tak pak účtu pomalu nemá smysl jako suše možná lepší zastavit podívat se dozvím asi
0:09:21jo nebo
0:09:22prostě ztrácíte ztrácet textů písem trasy pro byste měli mít na to řízení a ne
0:09:27na jste poslouchali
0:09:28poslouchali neviděl
0:09:35tak _e jak jsem říkal tesco může být primitivního systému že si nahrajete deset babek
0:09:41a nějaké lety to dohromady po opravdu komplexně systém kde
0:09:45_e ste schopni syntetizovat jakýkoliv text
0:09:49to znamená nehledíte už na nějakou slovní zásobu
0:09:52_e chcete syntetizovat běžný text to znamená složité se zjistí že tam máte nějaký věty
0:09:58máte tam třeba přímou nepřímou řeč máte tam nějaký otazníky měli byste něco dělat základním
0:10:03tónem
0:10:04to pruhový takže v tomto případě to opravdu služ
0:10:10tak struktur _e
0:10:12někdo má nějaký dotaz
0:10:14ohledně to je takle no
0:10:16to začátku
0:10:19jo takže se podíváme na strukturu jak takový systém většinou může vypadat
0:10:26máte tam
0:10:28takový čtyři základní bloky
0:10:31první bloky textová analýza to znamená
0:10:34vy nastup dostanete nějaký text
0:10:36jo může to být to může to být nějaká webová stránka může to být prostě
0:10:40knížka může to být
0:10:42cokoliv něco se prostě textu
0:10:47to vy nějakým způsobem musíte
0:10:51prozkoumat zjistit jestli to má nějakou strukturu
0:10:54eventuálně pokud to má strukturu tím myslím odstavce věty přímá řeč nepřímá řek
0:11:02názvy kapitol třeba cokoliv
0:11:05_e jaké zjistíte strukturu musíte se s tím nějak poradit když byste si vzali třeba
0:11:10toho stránku a byla tam tabulka doby fajn i začít diktovacímu ty vybudit kteří
0:11:14třeba teďka začíná tabulka a má čtyři sloupce api řádku jo a první sloupec a
0:11:19tady začít jo takže už nějakým způsobem musíte to nějak uřež _e ošetřit takže
0:11:25musíte to uzavřít do nějakých
0:11:27dalších
0:11:28jako by dalšího textu nebo další řeči oko nepopisujte v podstatě ten
0:11:34já se tam nějaká textová normalizace
0:11:37což není nic jinýho že když vám tam někdo nafláká tohle stojí sto dvacet pět
0:11:42korun a tyto vypíše číslama
0:11:44tak byste to měli asi říct jako by sto dvacet pět ne jedna dva pět
0:11:48krčil sto dvacet pět korun
0:11:51teďka máte český jazyk který se skloňuje a máte tam ještě budu přístup kus podnětem
0:11:56takže byste měli se podívat i se vám tam sedí prostě pády jestli vám tam
0:12:00sedí
0:12:01tady tyhlety věci a už to začaly hodně složitý
0:12:05a potom je tam lingvistická analýza takže ještě můžete začít zkoumat jestli jsou to graf
0:12:11a
0:12:12a další podobné nechutné věci jako že číslo si můžu stejně psát různě číst _e
0:12:18můžu se
0:12:21můžu mít _e dopad na kontext
0:12:23jo to znamená
0:12:25musíte podstatě pochopit N tak
0:12:27pokud máte něco jednoduššího jako je zase nějaká navigace nebo
0:12:32nějaké call centrům nějaký tady I D R
0:12:34tak toto s trochou štěstí se na vynechat jo pokuď prostě máte ten textury dobře
0:12:39vopravovanej
0:12:41_e cache na to textu normalizaci toto by se dalo přeskočit jednoduchý při
0:12:46to co by vám měla vypadnout je nějaký relativně čistý textu znamenáte který opravdu chcete
0:12:51jakobín syntetizovat neměli by tam být žádný speciální symboly jaký dolary jo nějaký číslo prostě
0:12:57text
0:12:59tak máte fonetickou analýzu
0:13:01teda to statis toho samýho textu vám udělá jakoby mluvený textu znamená vám z toho
0:13:06udělá fonémy předpokládám že taky víte C F M
0:13:09to znamená něja převede vám to byl nějaký sekvence jednotek který prostě členy jsou jo
0:13:15takže nějakých akustický takových základních jednotek
0:13:20toho
0:13:21mám teda vypadnou fonémy které sou nějakým způsobem tak zvaný ten taking se jako vyváži
0:13:27spi je tady k tomu textu to znamená mám říká
0:13:30máte nějaký řetězec fonému
0:13:33a on vám říká tady začátek věci tady je konec věty tady by měla jít
0:13:37intonace nahoru tady dolů tady dej důraz tady bude delší pouze _e prostě nějaký tak
0:13:43toto se
0:13:45vlastně je vstupem zblízka analýzy která na základě těch stavů
0:13:50rozhodne o tom jak je tam základní tom jestli D hlas nahoru
0:13:54jestli ten hlas dolů jaká je tam vlastně jaká je tam prodleva
0:13:59jestli se má vyšší hlasitost a jakýmsi způsobem na modeluje tady tyhlety tři proměnný to
0:14:05sou podstatě při důležitý proměnný rychlost základního po u
0:14:10to znamená jestli mluvím prostě hlubokým hlasem jestli dávám otázku nebo ukázku jo tak je
0:14:16tam nějaký duration to znamená
0:14:19_e člověk dává důraz když dávat důraz na něco na něco ve větě tak to
0:14:25řeknete víc nahlas a taky to řeknete třeba pomaleji
0:14:29jo a takový ty vy perníkový slova říká se prostě strašně rychle jo takže ta
0:14:34věta má nějakou ta to tam obama nějakou dynamiku jo to sou takový to sou
0:14:39parametry to nějaká spojit a spojitá funkce která by měla
0:14:44by
0:14:46víc modelována tady s téhleté prosecké analýze
0:14:50no a výstupem s toho
0:14:52Ú uši nějaký opravdu detailní popis toho co se má syntetizovat a to se pošle
0:14:56do samotné syntézy troše nějaký jakoby signál procesing
0:15:00který vezme tady tyto informace to sou nějaký prostě znaky nějaký fonémy a tady ty
0:15:07kontrolní
0:15:08kontrolní křivky
0:15:10základního toho hlasitosti a vyrenderuje nebo jako kdyby syntetizujete vlastní signál
0:15:18je to jasné
0:15:22ahoj
0:15:23tak teďka k těm jednotlivým bločků
0:15:27jo tady je popsaný v podstatě co se tam co se tam je
0:15:32takže textová analýza jak sem říkal
0:15:34dokument structure znamená detekce
0:15:37struktury dokumentu textová normalizace lingvistická analýza
0:15:41obvykle
0:15:43toto je věc která je jazykově závislá to znamená když budete mít českou syntéza logickou
0:15:48syntézu potom musíte vždycky stavět solidní čili ten den s toho prostě
0:15:53sem dál nehněte
0:15:55jsou tam obvykle nějaká pravidla třeba pro tu normalizaci nějaké gramatiky
0:16:02takže X to analýza
0:16:05jak jsem říkal
0:16:07snaží se porozumět textu
0:16:13zjisti strukturu dokumentu takže máte kapitoly paragrafy tabulky
0:16:19jo měli byste tam dat nějaký výtvarníky to znamená ten dokument třeba nějak popsat
0:16:25_e rozdělení věc jo skončí věta skončí odstavec dat tam jakub
0:16:32textová normalizace
0:16:34de o
0:16:36to substituovat netextové nějaké tloukli netextové znaky do textové podoby takže čísla data
0:16:45jo máte dva celá třída celá čtyři nebo druhého čtvrtý třináct třicet nebo můžete říct
0:16:51kliniku druhý
0:16:53to závisí na
0:16:55na tom jak to chcete pojmout zkratky B u tý nebo jestli to rozepsat jo
0:17:00ne vždy ty zkratky můžou mít víc významů takže
0:17:04takže jako do sepisování třeba
0:17:06do konkrétního významu už může znamenat pochopit ten text koš
0:17:11co Š je to složitý a pak korektně rozepsat danou zkratku
0:17:16speciální symboly a samo o sobě matematičtí s matematické formule nebo nějaký chemický rovnice vzorečky
0:17:23touž koje
0:17:24celkem složitý
0:17:27jo bacha za to některé jazyky obzvlášť čeština sou se skloňuje to znamená musí tam
0:17:32určovat
0:17:33určovat _e shoda přístup kus podnětem mapa
0:17:39tady je příklad jednoduchý příklad nějakýho regulárního výrazu jaksi poradit _e s číslama jo takže
0:17:45když máte jedničku a zatímco u
0:17:48je nějaký čísílka tak to přepíšete na s po
0:17:51nechali tam ty dvě další čísílka máte další regulární výraz který vám potom už předpisuje
0:17:56tady ty
0:17:57desítky a tak dále a tak dále teoretickou informatiku strofy měli takže víte co
0:18:03víte co to obnáší
0:18:11lingvistická analýza
0:18:15jak jsem
0:18:16říkal můžete mít slovo třeba banka nebo taky třech
0:18:21že jo závisí prostě na kontextu takže pochopit
0:18:24pochopit kontext
0:18:27_e tady kdybyste si to chtěli představit češtině tak máte slovo nitromind monitoru
0:18:33jo prostě píše se po stejně a vy byste měli když to syntetizujete říct tak
0:18:37fotosyntézy zlatko vnitro nebo je kontra
0:18:40nihilistická analýza by vám měla říct
0:18:42_e H tak tady to s kontextu
0:18:44ni pro tak tam bude asi
0:18:46měl
0:18:47zatímco pokud to tam budete mít prostě vokolo hromadu nějaký chemických sloučenin tak to možná
0:18:52bude mít
0:18:54jo takže to je prostě úkol lingvistické
0:19:01_e důležité taky je tady že ona by měla pochopit podstatě o čem ten text
0:19:05je určen je ta věta a dat tomu korektní takovou highlevel proslovy
0:19:11u řeči se vám může stát že vy můžete mít ten samý text ale pokuď
0:19:15to řeknou
0:19:16řekne jeden člověk a dá tomu
0:19:18dvakrát na tom pokaždé jinou proto B tak můžete totálně otočit význam té věty prostě
0:19:23tím že a ty důraz nesprávně nebo na nějaký místo jiná
0:19:26tak vy podstatě si můžete pohrát jakoby z _e
0:19:30jako by s tím vlastním obsahem s tou informací o takže to takovéto je to
0:19:35prostě
0:19:36složité jo je potřeba jako to opravdu pečlivě
0:19:40pečlivě tady toto řeší
0:19:45fonetická analýza
0:19:50znamená máte právě homo graf a takže slova který se
0:19:54stejně píšou různě čtou snažíte se je nějakým způsobem identifikovat
0:20:00of logickou analýzu to se vám může hodit později pokuď máte slova tak rozdělit na
0:20:05_e rozdělit na
0:20:08na nějaké kořen
0:20:10předpona příponám že se vám to hodit protože super jakési slabiky je kissing které se
0:20:15opakují
0:20:17_e na konci let proto jsou to vržen to znamená
0:20:20těch slov který tady generujete se snažíte tedy na konci dostat nějakou sekvenci nějakou sekvenci
0:20:35ta příklad když _e tomograf disambiguation slovo street read
0:20:41ba
0:20:43B
0:20:48morfologická analýza snažte se identifikovat přípony předpony
0:20:55_e pro tu samou to znamená vlastně převod
0:20:59písmen na nějaký fonémy
0:21:02češtině to celkem jednoduchý protože češtinář foneticky jazyk tudíž _e máme tady pár nějakých základních
0:21:08pravidel jako že
0:21:10dvoji možná chvil
0:21:12je tady něco takového co by měl odpovídat právě tomu v kuch
0:21:19že třeba zase jeden znak to je jako by dva fonémy K V
0:21:24když máte F háčkem a je předtím dotaz L nebo S
0:21:29v podstatě svislou jako jo to je to iksko na
0:21:33na X
0:21:35pak máte s podobu smělosti to znamená že řekne když se napsaný svou bůh _e
0:21:41takto nic tak to je čili neříkali bůh _e ale řeknu bůch
0:21:45to znamená
0:21:46mění se tam mění se to vlastně ta znělost
0:21:50spodoba call artikulační že když máte buď písmenka to select obvykle lidí prostě řeknu jako
0:21:55C
0:21:56že Č S
0:21:58jo banka takže nosovy _e
0:22:01ale je to relativně jednoduchý prostě pár pravidel je to unk jo když ste v
0:22:05angličtině úst na to podstatně hůř protože
0:22:08tam se
0:22:09každý slovo čte trošku jinak ta motion se to třeba neřeší pravidla máme řeší se
0:22:13to
0:22:14vyloženě statistický takže máte nějaký máte nějaký účinek
0:22:20_e obvykle se používá nějaký konečné stavové převodníky
0:22:24kdy vstupem je právě psaný text výstupem je statistický nějak
0:22:29sekvence fonému k
0:22:31kde se říká že tak to asi bude znít jo sou tam občas nějaký
0:22:38tak _e nějaký dotaz tady k té první
0:22:42krabičce
0:22:50tak pokuď se to všem jasný tak se podíváme pro na pro matickou analýzu to
0:22:55znamená tady se snažíme podstatě tomu nějakýmu opakované sekvenci fonému
0:23:00přiřadit
0:23:02vlastně hlasitost
0:23:04to znamená jak nahlas
0:23:05ten
0:23:07počítač bude mluvit
0:23:08nějakou konturu základního tónu to znamená jak vysoko bude ten hlas posouzení a nějakou rychlost
0:23:21jak se to jak se to dá dělat svou
0:23:26metody
0:23:28například
0:23:30sou nějaké akustické metody které vám
0:23:33vlastně vemou ty jednotlivé tady
0:23:36a uloží vám vloží vám
0:23:38do nějakého konkrétního času
0:23:41té věty vám vloží nějaké události které říkají tady bude důraz tady bude prostě zvýšení
0:23:46základního po jaké diskrétní jednotky
0:23:49no a pak se to pro ženy nějakým filtrem a ono se vám to krásný
0:23:53vyhodí a to se použije druhá možnost je želíz detekujete
0:23:57nějaké důležité částí nějaké
0:24:00valí s nebo nějaký os to znamená kde tenhle
0:24:05jako by má vrchol třeba základní to na kde má naopak nějaké není
0:24:10jo vypadá to takto to znamená
0:24:13vy máte čas takle vám plyne nějaká ta věta tady vám to říká
0:24:18tady bude tečka prostě zvýšení jako základního tónu tady bude druhý a tady se na
0:24:23konci věty takže ten za sedum
0:24:26pak máte druhou druhé nějaké údaje které vám říkají něco akcentu takže třeba
0:24:32třeba že ten člověk nemluví jako by
0:24:35čistou češtinu ale že třeba _e ze slovenska nebo s poukázek že má prostě nějaký
0:24:40cen takže toto můžete doplnit nějaké
0:24:42nějaké podružné
0:24:44podružné informace
0:24:46no pak to pro ženete filtrama sečtete dostanete s toho nějakou takovoudle obálku
0:24:51základního to
0:24:54jo druhá možnost sou právě tady ty eval E s hýrous to znamená máte nějaké
0:25:00důležité informace
0:25:01máte nějakou obecnou kulturu té věty jako že by ta ten hlas měl postupně klesá
0:25:06to držet se v nějakých limity
0:25:09no a na základě toho vy tak vygenerujete
0:25:12vygenerujete nějakou křivku
0:25:18toto je _e
0:25:20lo based nebo nějakými pravidly řízení _e řízena vlastně
0:25:26syntéza
0:25:29prozodie druhá možnost je že si můžete posbírat spoustu dat
0:25:34a na trénovací nějaký statistický model
0:25:36takže prostě víte
0:25:38tak jak rozpoznávat _e řeč tak v podstatě nebudete rozpoznávat jakoby _e ve signálu
0:25:43do nějakých příznaků ale budete rozpoznávat jako B S
0:25:48s průběhu základního tu nula a hlasitosti
0:25:52na
0:25:54nějaký maslowa mazdu právě takovýchto podobných parametrů a ta převede to statisticky
0:26:04tak
0:26:06další bloček
0:26:11poslední je syntéza vlastního signálu
0:26:14to znamená teďka máte fonémy a máte nějaký máte právě nějakou obálku základního tónu a
0:26:22už jenom potřebujete vybrat vlastní jednotky dva máte nějakou databázi jednotek můžou to byt fonémy
0:26:27cokoliv slova
0:26:28a potřebujete jenom ste databáze vybrat vhodný jednotky získaných signál se tyto dohromady zas tomu
0:26:35nějakou obálku základního tomu a
0:26:38máte řečový signál
0:26:43jaké použit jednotky
0:26:46jednotek je
0:26:48spousta můžete život těch nejjednodušších co sou nějaké a ufony
0:26:53přes fonémy
0:26:55pak jsou to například by von i koš sou
0:26:59co šest jednotka odpůrci jednoho fonému do půlky druhýho fonému proč je to odpůrci do
0:27:05půlky je to kvůli tomu že
0:27:08_e ten fonémy uprostřed stabilní
0:27:11jo když máte nějakou samohlásku _e tak na prostě uprostřed
0:27:15bývá stabilní takže ty jednotlivý periody základního tónu se moc nemění zatímco když přecházíte z
0:27:21jedno fonémů do druhýho tak je tam nestabilita a vy potřebujete právě zachytit
0:27:25to nestabilitu zatímco když to lety to dohromady tak to bude ten připravit těch stabilních
0:27:29částech to znamená těch koukání von
0:27:33ideální je použit ještě nějaké další jednotky takže třeba něco postavy na slabikách nebo slovech
0:27:39dělali celý věty potom můžete prostě
0:27:43_e cílem je nějakým způsobem z minimalizovat počet konkatenací znamená pokud se bavíme to davu
0:27:50koukat relativní syntéze
0:27:53takže počet míst kde se spojují kde na sebe navazují nějaký _e nějaký části signál
0:28:01tady
0:28:02tabulka jednu jednotek
0:28:05to znamená můžete jít od nějakých se třiačtyřiceti jednotek po hash nějakých
0:28:10stovky tisíc co se týká slov
0:28:13kvalita čím cvičení další máte jednotky tím máte větší kvalitu protože
0:28:18máte tam Í nějakých přerušení
0:28:20máte to také ale náročnější jakoby _e na paměť nebo na databázi
0:28:26a stejně se vám může stát že budete něco vo který nemáte jakoby databázi to
0:28:30že budete muset syntetizovat
0:28:32nějakým
0:28:34takže je rozumné mít nějaké slabiky nebo nějaké jednotky kterých máte rozumný počet a ste
0:28:40schopni s toho jako by vždy kdykoliv slepit
0:28:43slepic _e jakékoliv slovo
0:28:49tak výběr jednotek
0:28:59pokud se bavíme okoukat relativní syntéze s _e vlastně přístupy
0:29:04syntéze můžou být _e můžou být dva
0:29:08jedna je takzvaná koukat relativní druhá je formantová takže koukáte nativní syntéza je
0:29:15tak vy máte právě nějaký
0:29:17jednotky v databázi
0:29:20a v je prostě lety to dohromady jo takže tak takhle fungují takle fungují call
0:29:25centra fungují ideas systémy funguje vaše navigace
0:29:29jo máte tam prostě nějaký jednotky nějaký slova ten slovníky omezené jo
0:29:34jenom se to lety dohromady
0:29:38_e ta formantová syntéza funguje
0:29:41funguje vlastně jinak to funguje tak že máte nějaký model řečového traktu
0:29:48máte tam spoustu parametrů
0:29:51a vy podstatě jenom měníte nějakým spust pojď tím způsobem
0:29:56s tu
0:29:57jo to znamená máte tady nějaký buzení zas tady máte nějaký parametr základního tónu máte
0:30:03nějaký generátor impulsů pak máte
0:30:06tady nějaký _e generátor
0:30:09_e šumu
0:30:11no a celý to prohání ty nějakým strašným filtrem
0:30:16tedy má simulovat _e licky
0:30:20historické hlasové ústrojí a ven vám vypadne řečový signál
0:30:25jo takže tady v podstatě na měníte nějakým způsobem kontinuálně parametry a ale ne nepijte
0:30:30dohromady žádný znak
0:30:37takže pokud meste konkatenace ty nyní syntéze tak
0:30:41jak vybrat jednotky
0:30:45ideálně si necháte od někoho nahrát
0:30:49pár hodin pár desítek hodin řeči to znamená někdo sedne a bude vám tečka číst
0:30:53nějaký texty
0:30:55vy to musíte přepsat
0:30:57pokuď máte nějaký řečový nástroje tak _e tři provedete automaticky zarovnání to znamená vám
0:31:04co jela jmen víte
0:31:07zarovnání fonémů
0:31:10když _e máte
0:31:12_e rozpoznávače řečí a vy musíte jakoby manuální přepis tak můžete přepnout do modu že
0:31:18obama bude rozpoznávat slova levou veme ty slova kterýmu dat jako bratrův a jenom vám
0:31:23prostě ty slova přesně zrovna na ten signál tak jak se mu nejvíc líbí že
0:31:27tam jsou
0:31:28tudíž vám automaticky řekne která část signálu odpovídá jakým von
0:31:34jo a pak vy to můžete už jenom rozsekat jo že to nemusíte všechno dělat
0:31:38ručně
0:31:39když jsem teda dělal svůj diplomku tak sem to všechno dělali čísel tak měl jsem
0:31:43asi tří ty nějaké řeči že to celkem šlo to
0:31:47pěknou pro
0:31:51jo takže máte nějakou řečový databázi necháte máte k tomu přepis musíte k tomu mít
0:31:58hranice jednotlivých slov nebo fonému
0:32:01toto nějakým způsobem
0:32:03za indexuje té
0:32:05pokuď máte tu možnost takto můžete nějakým způsobem prozodicky olej bilovat takže můžete si k
0:32:12tomu nechat informaci jaká je tam výška základního tónu hlasitost
0:32:16a
0:32:17potom když se snažíte jednotky
0:32:21vlastně tvoří syntetizovat
0:32:23tak
0:32:24se snažíte zajistit to aby to syntetizovaná jednotka
0:32:28kterou vy chcete vyprodukovat byla co nejblíž tady ho přesouvat databázi takže to může bejt
0:32:33nejenom jako že foném _e by měl být
0:32:36honem a ale ne jako že tam bude éčko
0:32:39ale že by třeba hodnotou základní oponou takovou jako vy chcete syntetizovat by měla být
0:32:44co nejblíž protože jakýkoli změny který tam provádíte
0:32:49máme na je že můžou být potenciálním zdrojem nějakých problém
0:32:53a potom se snažíte minimalizovat nějakou vzdálenost mezi vlastně tu konkatenaci to znamená snažte se
0:33:00dívat aby ten kontext když tady máte třeba foném a
0:33:04tady máte foném byl
0:33:06tak
0:33:07abyste databázi když tady byl taky foném _e tak za ním byl opravdu taky ten
0:33:11foném byl protože když by to bylo třeba von N T
0:33:15tak _e
0:33:16tady bude zní trošku jinak a potom když to slepice dohromady tak
0:33:19to bude znít
0:33:26potom co vlastně vyberete takto jednotky ta kuš provádíte nějakou
0:33:33vlastní syntézu to znamená kuš
0:33:35sáhnete do databáze vemete si ten signál se pěkného dohromady
0:33:40pokuď máte nějaký parametrický model tak tam nemáte v databázi uloženy vyloženě signál vyloženě ty
0:33:46vazká ale něco co vám to popisuje takže nějakou nějaké spektrální koeficienty cokoliv to pak
0:33:52slepice dohromady a
0:33:55syntetizujete to
0:33:58toto je formantová syntéza v dnešní době už se to takle jako moc nepoužívá
0:34:06na druhou stranu _e z poslední doby se začaly objevovat _e syntézy pomocí ničem N
0:34:11to znamená je to s něco podobnýho je když máte rozpoznávač
0:34:15tak _e v podstatě
0:34:17zase máte nějaký syntetizátor které máte nějaký model který vám kteří vám generuje parametry
0:34:23parametry pro
0:34:25jako by nějaký takovýto
0:34:28takovýto mechanismus který fotosyntetizujete vlastně signál
0:34:43plus v podstatě říkal tady je no
0:34:47takové zajímavé zamyšlení
0:34:50jaká je závislost podstatě kvality výstupů na
0:34:54množství
0:34:56nebo na
0:34:58na množství nebo na rozptylům mezi kvalitním Í a málo kvalitními segmenty
0:35:04jo ta formantová syntéza konkrétně to má tu výhodu že ten signál zní
0:35:09furt stejně kvalitně ale to stejně blbý
0:35:12jo zatímco když máte nějakou konkatenaci ní syntézu tak můžete mi
0:35:17hodně dobrou kvalitu ale stává se vám že máte jakési procento
0:35:23_e vygenerované řeči kde prostě to skřípe protože to tam zrovna nesedí ty jednotky a
0:35:29a
0:35:31tak je to tam slyšet nějakým pan se nebo prostě spojitosti
0:35:38metody vlastně vlastního nějakého spojování můžete
0:35:43spojovat čistila sklad souš
0:35:45není zrovna ideální protože máte nespojitosti signálu
0:35:50můžete se snažit nějakým způsobem překrývat
0:35:54o uhodla to znamená uhodla pova a ideální je nějakým způsobem zařídit aby to bylo
0:35:59synchronizovaný základní pouze
0:36:02protože když byste to překrývaly a synchronizovaný to nebylo tak _e tam pak vznikají
0:36:07vznikají nespojitosti
0:36:11a úplně nejlepší je když se použije nějaký motel to znamená nepracuje se z vlastní
0:36:18basket a začne se pracovat s nějakým parametrický popis entry vám říkala jaký sou tam
0:36:24jsou tam vlastně parametry nějaký frekvenční parametry
0:36:27toho signálu což podobně třeba nechce céčka nebo ty opička
0:36:31prostě jsou tady nějaký parametry a ten mobil vám říká
0:36:35jak to vypadá
0:36:39tady je příklad
0:36:42tady je příklad nula to znamená odhodlat _e do
0:36:46kdy máte nějaký v asko
0:36:49a vy chcete
0:36:51toto v lasko
0:36:53zrychlit dvakrát
0:36:54jo to má máte nějakou řeč a chcete aby to bylo řečený dvakrát rychleji
0:36:59jo nemůžete to udělat tak že zvednete jakoby že to přehled dvakrát rychleji pak to
0:37:04zní jako četnost
0:37:05jo takže
0:37:07to co uděláte
0:37:09nejprimitivnější je že uděláte si tady takový okýnka jo jak tady vidíte
0:37:15no a ty okýnka vpodstatě tak to jako by na ni znáte
0:37:20mít k sobě
0:37:21no a každý to okýnko jako bývá potřebuju schovaný to jeli váhovací okno
0:37:26jo
0:37:27znamená to má potřebu jakoby schovaný ten signál no a pak to jenom sečtete ale
0:37:31jak vidíte když se tady podíváte tak máte podstatě ty špičky základního tomu máte tady
0:37:36tak jako dost blbě
0:37:38jo že tady v tomletom úseku to vůbec neodpovídala bude to tak todleto _e
0:37:43jo vy byste chtěli aby byly pěkně
0:37:47pěkně pravidelně od sebe
0:37:50jak tomu zařídit to jak to zařídit aby to tak bylo je právě
0:37:55_e sola to znamená když synchronnost takže vy synchronizujte tady tyhlety okýnka
0:38:02jak máte
0:38:03tyto body takový synchronizujte tady sme špičkám a základního to
0:38:08jo a pak když je chcete jako by ten hlas dvakrát access i tak můžete
0:38:11třeba každý druhý vokýnko vyhodí
0:38:14no a dostanete v podstatě dva krát rychlejší řeč která zní jako dobře
0:38:20jo což
0:38:21toto by se mělo dít pokud máte nějaký jen plechem enkodéry který jakoby umí nebo
0:38:26jiný turína editování
0:38:29který umí jakoby zrychlit zrychli ten daný zvuk aniž by ho jako by sekvenčně frekvenční
0:38:34poničili tak dělají většinou tady toto jo takže prostě si tam udělal nějaký takovýto
0:38:40takovýto okýnka
0:38:42to třeba půlku vyhlašuju a
0:38:44tyto
0:38:52jo to znamená tady jenom nějaká funkce která se snaží jako by
0:38:58mapovat původní
0:39:00nějaký signál a signálový
0:39:03to znamená vy tady vemete nějaký okýnko
0:39:06na s touto periodu základního tónu máte takovýto signál
0:39:11a pokuď chcete
0:39:13tohle naopak slouží k _e prodloužení
0:39:17řeči
0:39:18pokuď chcete
0:39:22_e pokuď chcete
0:39:24vygenerovat nový signál tak si musíte jakoby měří vygenerovat nové periody základního tomu
0:39:29a jim potom přiřadíte s toho původního signálu nějaký
0:39:34ten signál potím okýnkem
0:39:37a nakonec to musíte všechno složit dohromady
0:39:44no taková trošku drsněl a na potom ušet právě parametrický model to znamená tady třeba
0:39:49harmonik N plus model který funguje tak že
0:39:53jak máte řečový signál
0:39:55tak ho rozdělí na harmonickou a šumovou složku
0:39:59jo dá se určitě zhruba do těch
0:40:02čtyř kiloherc vtom signálu převládá harmonická složka to znamená to co vlastně signál který je
0:40:09tvořen zejména
0:40:11jako by kmitáním hlasivek a nasednou rezonanci dutině ústní to co je vejš potom už
0:40:17většinou bývá a šumová složka jo takže to je prostě různý takový téhož
0:40:23_e
0:40:24takový prostě signály který mi nemají zdroj
0:40:28_e klasická
0:40:30jo takže vy můžete vzít spektrum nějakého řečového signálu takle to třeba pěkně rozdělíte říci
0:40:36fajn
0:40:37tady od nuly do čtyř kilo hertz to budu
0:40:39_e to budu
0:40:41modelovat nějakým parametrickým modelem
0:40:44a o čtyři vejš to budu
0:40:46modelovat nějakým
0:40:48nějakým šumový model N ten šumový model může bejt jednoduché jak to že si uděláte
0:40:53jenom
0:40:54jako obálku jednoduchou obálku spektra potom hrozí té šumavy
0:40:58generátor potom dostanete ten samý signál
0:41:02samozřejmě to proč se to tady musí dělat _e s modelovat tom vlastně v tom
0:41:08harmonickým
0:41:09harmonické části parametrický je
0:41:13nevím jestli ste brali
0:41:15_e se tam
0:41:16tady honza černocký říkal něco o percepci
0:41:20lidský ucho je tady vnějších
0:41:22nižší frekvencích citlivé žirafa
0:41:25jo to znamená vy ste schopných určitých frekvencích poznat třeba že vám nesedí fáze
0:41:30složku vyšší frekvenci je _m úplně jedno
0:41:33jo tam když prostě byste syntetizovaný a tady byste
0:41:36dali
0:41:38já nevím šest kilo sedum kilo a dali jeden signál a pak sedum kilo posunuli
0:41:42o půl fáze
0:41:44o půl P třeba dopředu nebo dozadu tak trochu to nepozná zatím což byste to
0:41:48syntetizovaný a tu fázi posunuli tady nějaké frekvenci tak vám to menu když lidi
0:41:53_e tou plochou prostě to pozná jo takže proto metod tady takové
0:41:57citlivější
0:41:59a teorie tady zatím harmonický modelem je takže
0:42:04vy podstatě si musíte
0:42:06_e zjistit základní to a pak říkáte že
0:42:10s klasická _e vám
0:42:13se neděje nic jinýho než že ten základní toho nějakým způsobem rozhoduje o vznikají tam
0:42:17harmonické nás
0:42:19znamená že zjistíte základní tón ten budiž třeba sto herců no a pak
0:42:26s toho spektra který tady vidíte nějaké
0:42:29_e s nějaké krátkodobé spektrum
0:42:31tak si vemete všechny násobky základního tónu a pro ty si zjistíte jakoby hodnotu frekvence
0:42:42jo
0:42:44a
0:42:45ne různé hodnotu sekvence ale _e
0:42:49amplitudy to znamená něco zastoupených to všechno
0:42:52nakonec to můžete proložit ničím červeným soše nějaký parametrický model podobně to bývá únosce teče
0:43:00a máte něco co vám říkal diskrétní kepstrum to znamená ten máte něco co modelujete
0:43:07všechno
0:43:14toto
0:43:15tak jak se to tady viděli tak vy toto provedete pro každý třeba zase deset
0:43:20milisekund jo nebo nějaký dvacet milisekund signálu
0:43:23a pokud máte databáze kterou chcete syntetizovat máte tam ty jednotlivý fonémy jednotlivý jednotky
0:43:29tak máte pro mě zase nějaký rámce a vtom těch rámcích máte uloženy parametry který
0:43:34vám popisují tady tuhletu obálku spektra plus třeba tadyhle ten filtr který vám zařizuje
0:43:40tady ty vysoko
0:43:42vysokofrekvenční složky
0:43:44řeči
0:43:47potom pokuď chcete syntetizovat a chcete jako bitu řečnění to znamená chcete říct fajn proč
0:43:53mám nějakou promluvu a chcu aby to
0:43:56mluvilo třeba dvakrát tak dlouho nebo chci aby to mluvilo se základním tónem o
0:44:03jeden a půl násobek víš
0:44:05tak to co musíte udělat je že musíte vzít
0:44:08v podstatě ten původní signál říci fajn tady mám nějaké okamžiky
0:44:13základního tónu
0:44:16rok které mám ty parametry v řeči
0:44:20to je tady toto
0:44:21a pokuď chci aby to znělo jako by
0:44:26dvakrát tak vysoko ten hlas takže by to prostě neznělo ahoj ale bylo to ahoj
0:44:31tak
0:44:32vy musíte mít dvojnásobný počet
0:44:35period základního tónu rozumná máte
0:44:38máte dvojnásobnou frekvencí
0:44:41takže uděláte jakousi mapovací
0:44:44mapovací funkci která vám říká
0:44:48jaká ta nová perioda dědí
0:44:50informace z nějaké kterou už máte jo takže tady vidíte že v podstatě rozhodněte
0:44:56rozhodujete
0:44:57kterým si to znamená tyhlety dva periody mají stejný jako by signál
0:45:01stejný parametry jako tady tak
0:45:04no a jak máte tady tyto informace tak pak můžete spustit mašinku která vám zpětně
0:45:09syntetizuje s těchto parametrů vám udělá jako by to masku
0:45:14jo a dostanete signál který třeba mluví vyšším hlasem v tomhletom případě mluví pomaleji
0:45:20jo tady zas vidíte že vám
0:45:22ta délka toho
0:45:24základního ptal délka periody je stejná
0:45:27jo až na to že jich máte víc jo takže prostě se vám natahuje čas
0:45:33chápete to tady ty obrázky dává to smysl
0:45:37nebo to set utratili
0:45:46no to necháte
0:45:52jo na ose X máte čas
0:45:56_e zkusíme se
0:45:57kreslit je to nádhera
0:46:06tady máte čas
0:46:11s tím
0:46:35_hm
0:46:36víte někde předtím kreslí
0:46:54no
0:47:02tak to zkusíme klasickou metodu
0:47:04značeny
0:47:08takže máte signál
0:47:11řečové který vypadá nějak takto
0:47:15jo měli toto sou
0:47:17jednotlivý periody základního to víte co
0:47:22jo
0:47:23víte co to je dost kdo neví se perioda základního to
0:47:31kteří se potupil neusmívajíc takže nevím jestli ví nebo neví
0:47:37do toho neví
0:47:41toto vy
0:47:45kdy
0:47:47jo což je tady ta jsou tady ty jedničky
0:47:56vy pro každou tuto periodu
0:47:59můžete
0:48:00si říct pro tuto periodu mám nějaký takovýto signál
0:48:06tedy můžete tak jako by nějakým oknem vyvalovat takže vám s toho zbyde něco takovýho
0:48:13jo
0:48:14pro tento signál vy můžete udělat takovouto analýzu uděláte si spektrum
0:48:19jo dostanete něco takovýho co vidíte
0:48:22ztište si víte že základní tón
0:48:25to si spočítáte tady jo víte že tady máte prostě X samplů takže víte že
0:48:30základní tón je tady sto herců
0:48:33takže
0:48:35uděláte si tady ty zelený
0:48:37zeleny násobky spočítáte si
0:48:40frekvence pro
0:48:42pro vložíte toho nějakým modelem a máte nějaký parametry jo máte tady nějakej vektor parametrů
0:48:49který vám popisují
0:48:51tedy zpětně z těch parametrů můžete zpětně se syntetizovat přesně tenleten kousek signál
0:48:56jo máte tady nějaký čísel
0:48:59to máte pro každou periodu základního to
0:49:01no a teďka V pokuď chcete aby ten signál měl
0:49:05měl byl stejně dlouhej ale měl jakoby základní tom dvojnásobně vyšší
0:49:11jaká musí bejt perioda
0:49:14základního to
0:49:19když chcete aby sekvence byla dvojnásobná
0:49:23tak jo to znamená váš původní váš novej signál by měl vypadat prostě nějak takto
0:49:31jo takže
0:49:32v podstatě by to mělo odpovídat takhle nějak
0:49:35jo takže tady bude vždycky jakoby navíc nějaká perioda aby jenom to co musíte udělat
0:49:40i vy musíte si nějakým způsobem zjistit kde já vemu parametry tady téhleté periody která
0:49:45jako by je navíc v tom původním signálu není nejednodušším způsob je že to prostě
0:49:50nějakým způsobem namapujte na ty původ
0:49:52že řeknete fajn tady tahleta
0:49:55perioda bere
0:49:57tyto parametry tyhlety dvě sdílí
0:50:01to samý tady tahle zase třeba by odsáď
0:50:05a tak dále
0:50:06jo na naopak zase pokuď chcete aby ta řeč aby ten základní tón byl stejnej
0:50:12ale trval dvakrát tak dlouho takže aby ten člověk úvěru
0:50:16pomalu
0:50:18tak
0:50:18s periodou základního tónu neděláte nic
0:50:22protože chcete aby vyčkal osobnost A na ale pouze třeba každou druhou periodu zopakujte znova
0:50:28jo čímž pádem tam jako by to dáte
0:50:31dodá teda no na tom
0:50:34tu časovou
0:50:35složku jo takže to bude potom
0:50:39vypadat
0:50:40vypadat takto
0:50:45že to jasnější co se tam zhruba děje
0:50:51jo a tady jak to vypadá prostě nějak obecně jo přičemž si tady ještě to
0:50:55budete takovou věc a to že pokud by se netrefíte přímo do nějaké
0:51:00periody základního tónu takový ty s vy ty
0:51:04vy si to můžete to počítat takže uděláte nějakou lineární interpolaci
0:51:08jo aby to bylo ještě takový lepšího ale
0:51:11_e jsou
0:51:12detaily
0:51:16tady příklad jak to vypadá to znamená pokud na ten harmonický šumový model
0:51:22černý signály ten originální a ten červený R syntetizovaných jo zná vidíte že tady ztrácíte
0:51:28jakousi informaci jo která
0:51:31která se vám ztrácí díky tomu že vy to spektrum tady prokládat _e nějaký model
0:51:37ale jinak
0:51:38to je celkem blízko
0:51:44jo takže když
0:51:45syntetizujete bez jakýchkoliv modifikaci vypadá to takto pokud dáte dvojnásobnou
0:51:51frekvenci základního tónu tak vidíte že vám tady přibyly
0:51:55přibyly
0:51:57erozi základního tónu naopak když dáte poloviční tak
0:52:01vám tady zase chybí
0:52:08tak _e na závěr
0:52:10evaluace můžete
0:52:14můžete to nechat nějaký lidi poslouchat
0:52:17můžete
0:52:20zjišťovat jak funguje jednotlivé systémy a kvalitně fungují
0:52:24jak je vlastně jakoby
0:52:26ta
0:52:28řeč generováno S srozumitelná jestli ty lidí a kojetín potřeba nějak vadí že jsou tam
0:52:34chyby
0:52:36nechat otestovat
0:52:40tak co se týká nějakých praktických věci
0:52:44upřímně řečové to tady takovéto trošku starší slajdy takže nejsou to úplně nejnovější věci
0:52:51_e určitě epos systém by měl být _e pro res pro research zdarma je to
0:52:58za karvinný vět český
0:53:01speech texasu kolegové z plzně
0:53:05dělají já tady za chvilku něco pustím
0:53:09takže ty mají něčeho syntézu já jsem dělal jako diplomku plus potom byly nějaká jedna
0:53:14dvě bakalářky nebo taky diplomky
0:53:18festival _e
0:53:20edymburku je velmi dobrý
0:53:22ty mimo jiné sis
0:53:24se teďka dobře viděl tak se snaží vyvinout _e tesco který by bylo jazykově nezávislý
0:53:30s tím že už tam taky používají právě halenka to znamená ušet o
0:53:34zase o něco dopředu
0:53:37že celkem
0:53:38celkem fajn kdybyste měli rozvalem _e jako by vás toto téma zajímalo tak se o
0:53:41tom dá udělat velmi pěkná bakalářská určitě
0:53:45určitě diplomka jako je tam spousta věcí
0:53:52nějaký dotazy
0:53:54obecně něco co nechápete
0:53:57nebo chcete nezřetelně sotva zajímá tady s tohoto
0:54:10no zpěv _e
0:54:13tam je to takový jako tam je to složitější sou nějaký peterka nebo s určitě
0:54:18jako výzkumně byly nějaký
0:54:20nějaký pokusy jako že zkoušeli kartézském něco zpívat
0:54:24ono se to i dá jo tam je nejhorší _e tam asi naprosté budeme horší
0:54:29že vypotřebuje ten do dobře mít odhadnuty ty parametry
0:54:34_e prozodie jo to znamená těžko budete mít teďka systém kterým předhoďte text a on
0:54:39vám to zazpívá eventuelně text a motyl mám to odzpíval
0:54:43jo ale samozřejmě že to znělo pěkně ale ty lidi si s tím strašně hráli
0:54:47protože prostě ruční hladivých doprovodný ale diví teďka prostě má být nějaký vibrátory takový ty
0:54:52věci jo takže
0:54:54jo takže jako v reálu v reálné jo real prostě nějaký opravdu systém který byste
0:54:59k abyste bodě text a hodnoty nebo něco takovýho tak to není
0:55:03jo ale
0:55:04jako nula se prostě ukázat jo tady nám to krásně zpívá ale sou zatím se
0:55:09práce jako drbání se
0:55:12se s parametrem ano takže
0:55:18někdo i na další
0:55:21no nějakou za mu ta
0:55:32tak _e
0:55:34tady můžem zkusit si něco přehrát
0:55:40tady do sme diplomky
0:55:43a ty k té služ
0:55:48popravdě ani nevím co to je možná ten moc frčky systémy
0:55:53po kartotéky sou cvakání těch sloupu kouzelní ustavena
0:56:01takle mimochodem zní
0:56:03syntéza když tam nemáte pro shodný znamená máte jakoby rovný
0:56:08na první základní to
0:56:10jo v podstatě tam jenom myslíte mydlíte
0:56:13_e
0:56:15mydlíte jednotky eště by řek že toto není ani konkatenační jo to vypadá že vypadá
0:56:19_e že to je na nějaká ta
0:56:21takové té šílené diagram s těma
0:56:23s tím filtrem
0:56:25česká republika je maličká nic samotném se výchylky
0:56:32po akademie věc ten jo ten obvod a bobek gisů dva králíci sklo kluků kouzelníka
0:56:39pokus tu na
0:56:40tam už máte nějakou pro vhodný jo tam už když posloucháte tak _e push to
0:56:45tam prostě i klesne jako by to
0:56:51blok a bobek lidi sou dva králíci sklo kluků kouzelníka pokus tou na
0:56:57_e řekli že tady téhleté době oni měli bych formy jo to znamená měli jednotky
0:57:02jak se vám
0:57:03jak sem vám říkal
0:57:05jo když máte prostě nějakou
0:57:09nějakou řeč máte tam
0:57:12ahoj
0:57:13jo takhle máte zarovnaný ty fonémy
0:57:17tak ten kdy von vypadá takto
0:57:19jo to znamená když von jako
0:57:22jo ale sice to jako by
0:57:25takle to napište dohromady
0:57:27jo to znamená
0:57:29uprostřed jakoby fonému to vždycky rozseknete tam kde to jest
0:57:39poté co primi děr vladimír šídla zakázal ministrům cestování v dob
0:57:47byl ještě špidla první
0:57:52tak budou a
0:57:54to je něco zahraničního
0:57:57ale byly tam česky ukázky
0:58:00to je zase inte nějaké rozšíření psovi jo znamená zase tam volal že ohodnocen at
0:58:06a je tam nějaký
0:58:08je tam nějaký US příměří co nepamatuju jaký rozšíření
0:58:14bojím o nějaký lásku řeči nějakou tady tyhle voják a nevíte nebo jitka
0:58:23jedna chudá že na mě na jedinou ale to dělení proud směru
0:58:28jo poštovního něco líp ale
0:58:33tak to by speech tech tak to je slovně ale to je
0:58:36tady _e roku dva tisíce čtyři bot apotéky jsou dva králíci s klobouk
0:58:44česká republika je maličká zevnitř samotném
0:58:50no asi tomu nuly jako na konci
0:58:53tady nějaká moje
0:58:57moje diplomka
0:59:02a bobek jsou dva králíci
0:59:05oblouku kouzelníka
0:59:11česká republika je maličká země samotném evropy
0:59:18no neměl jsem jednotku neměl sem neměl sem jednotku pro srdci
0:59:24S
0:59:27hra teda sem to psal delfín ještě
0:59:35ahoj jak se ti vede dobře a co to je ale nestojí to za nic
0:59:42myslíš že dneska bude něco televizi nevím
1:00:05tady něco festivalu to znamená _e edymburku
1:00:10on chuck se sice
1:00:12jo dobrý tak se stal jel nestrčil stanek
1:00:16nesoucí dneska během sionistka do vězení
1:00:19emise je
1:00:21tak to vypadá když narvete český tektonický otec
1:00:30líbilo jsem sme deleted vylézt Y N párovým na todlento vylezla jsem se
1:00:35majestát není
1:00:37se lépe fungovalo jsem stránku jasem ta těch compete
1:00:43_e s tam umět co jste slyšeli tak tam právě bylo tady to _e harmonik
1:00:48employs model jo služ
1:00:51no to sice taky neznělo nic moc ale aspoň to dokázalo že
1:00:55tím hlasem syčet dokázal fakt vyhrát o důkazu to mi
1:01:01i různý
1:01:02velký proběhnou příklad abyste věděli jak to jako pustím dohadovat období války třicetileté
1:01:09stěnu měla příznaky vzorek metody jako jaksi můžete pohlo vlastně s _e střevo prom eprom
1:01:15odezva kromě toho povrchu
1:01:17o dva a třiceti letech
1:01:19bylo to že to můžete zrychloval můžete tu
1:01:23povolovalo od dobývá třicetileté chodu _e
1:01:30vyšlo základní to
1:01:35o dva i si cíle
1:01:39_e
1:01:41o _e ve _e
1:01:49takže s tím zábava
1:01:55love se může mrknout jenom jak to vypadá blesklo
1:01:58tak to je sou na příkop hodnot si
1:02:02tady no ty starý
1:02:03_e ještě starali syntéze osoby už bylo no koupit jako phongovo prostě
1:02:13toto je ukázka českého syntaktického hlasu firmy speech tech
1:02:20_e to vyruš to potom to obyvatel se zlepšit že soubor kouli mobilitu že strukturní
1:02:26jako fotky
1:02:29toto je ukázka českého syntetického hlasu firmy speech tech
1:02:34to co to jsou se tu ku co to sou
1:02:39toto je ukázka českého syntetického hlasu firmy speech tech
1:02:50toto je ukázka českého syntetického hlasu firmy jí speech ty
1:02:59příliš hloupoučký ku výhodná selské vozy
1:03:03takže to posunulo se sepne soukromý full contact vy
1:03:07zahraničních _e
1:03:09třeba to tohoto chodilo pro tu jazyky tady bude třeba
1:03:15roky jo když ho služko násobenou zkoušel jakým funguje prohovořil takže
1:03:21takže sto osum když to jako že to jsou číslo toho jo je tam jedna
1:03:25chyba
1:03:27jak se to něco blbě prochvalně syn s tím
1:03:29protože com
1:03:38ahoj
1:03:39ahoj
1:03:41ahoj
1:03:42deset metrů desátý metr
1:03:44sem českých naspod a kapely
1:03:47tato syntéza řeči je rychlá efektívní a na délku kvalitu
1:03:52zkuste si nechat přečíst tvůj vlastní text co se hodí tvé aplikaci
1:03:58takže všechny slyšeli efektivní
1:04:00takže _e tomu se ještě zapracovat na
1:04:05převodu grafem budov onen
1:04:12takže můžeme si to je zkusit
1:04:17_e k ještě
1:04:27a je třicet mail potěšen když moji se základce jo žhavit řádu těle přes
1:04:35takže jako v dnešní době bych
1:04:37tak jako řek že
1:04:39intel solutions celkem jako pěkně
1:04:45pěkně zmáknu ta
1:04:57tak nějaký dotazy
1:05:03něco co vás zajímá na toto téma nebo jakékoliv jiné
1:05:15tak _e tak
1:05:17zkusím mluvit trochu
1:05:19mírněji raz dva tři jo
1:05:22tak víc vítejte vítám vás pěkný podvečer poslední přednášky
1:05:26_e doufám že vám igor dál takové ty
1:05:30administrativně technické informace jako že sem ještě nestačil opravit ten projekt jsem nestačilo zadat ten
1:05:36projekt a tak dále všechno vám řekl jo musím to opakovat příští týden hnedka pondělí
1:05:41se uvidíme na zkoušce
1:05:43_e
1:05:44jak to bez materiálu je povolen jeden jednu listový dvou stránkový čičí
1:05:50tak se sem zvědav na ty několika vrstvé _e designing se na to těším
1:05:56_e
1:05:57poďme tady teďka k tomu numerickému cviku byl to že sme si vlastně během semestru
1:06:02moc _e nezapočítaly tak se to snažím dohonit teďka touto tohoto srdeční
1:06:07která bude trvat tak ní
1:06:09hodinu máš hodinu a půl
1:06:11podle toho jenom to rychle půjde na webové stránce máte _e zadání toho numerického cvičení
1:06:17a kupodivu tam máte i poměrně pečlivě zpracované řešení
1:06:22takže tam kde _e _m prostě to bude no opakovat _e že vytištěné řešení tam
1:06:27pojedou relativně rychle
1:06:29možná jako si _e _m to uděláme trochu víc do hloubky nějakých problematičtější věcech
1:06:34především
1:06:35tak je tam třeba někde deter dete véčko _e a asi trochu podrobněji vezmeme skryté
1:06:41markovovy modely
1:06:43tak poďme _e pěkně od začátku první část se týkalo pocel
1:06:49máme zadány nějaký signál který má C dvanáct vzorků
1:06:54_e nula celá sedum set sedum a tak dál a tak dále vidíte že to
1:06:58vlastně bude
1:06:59to je někde pěkně nakreslený _e dělá nám to pěkně _e
1:07:04jeden a kus periody
1:07:06sinusovky
1:07:08a prvními příkladem je zda je možné tento signál vyjádřit analyticky a pokud ano tak
1:07:14jak
1:07:15takže _e se třepnu do toho no látka signál si ještě jednou nakreslíme
1:07:22a _e vem řešit jo
1:07:26vlož
1:07:27toto je osa N
1:07:29toto je signál X N
1:07:31příklad první _e vzorečky padají takhle nula celá sedum set sedum jedna nula celá sedum
1:07:37set sedum
1:07:38nula
1:07:39_e mínus nula celá sedum se sedum mínus jedna a tak dále a
1:07:45skončilo to
1:07:47třemi
1:07:49vzorky
1:07:51A vypadají na
1:07:53takhle
1:07:54tak _e
1:07:56vzorky nula jedna dvě tři
1:08:00sedum
1:08:01osum devět deset
1:08:03jedenáct celkem dvanáct vzorků
1:08:05vidíte _e
1:08:07přímo jaksi syn bystrým pohledem že to sinusovka že jo takže pro toho kdo to
1:08:12úplně zapomněl
1:08:15že tady napíše sinus
1:08:17a teďka jaké medvědech budeme prakticky below doplatek na druhou do klapek a budete přemýšlet
1:08:24co vyplnit dovnitř jo zkusíme to datum dohromady úplně z hlavy
1:08:28bez nějakých pouček abyste vazby aniž by sme si museli pamatovat moc nějaký vzorečku
1:08:34tak toto je závorky asi tak přinde
1:08:38N určitě že jo
1:08:40protože to je čas
1:08:42co jinak
1:08:45asi jo
1:08:47pro dvě pí
1:08:51dobrý měřit a co ještě dál
1:08:54technika vám poradím takovou fintu
1:08:57sinus je goniometrická funkce a pokuste dobře poslouchali na základce nebo na střední škole tak
1:09:02dělá jednu periodu za dvě pí
1:09:05jo když se podíváme _e
1:09:09kolik mě vlastně trvá než tady ten signál udělá jednu periodu tak to je osum
1:09:14jo to znamená _e já teďka tam mám sinus dvě pí
1:09:18a za jednu periodu tam pravým číslo osum
1:09:21co snědá šestnáctý
1:09:23a to je nějaký moc rychlý
1:09:27takže tam budete muset přidat to čísílko který
1:09:32udělá tu jednu periodu přesně po osmi vzorcích a té čísílko lomeno osmi jo takže
1:09:37vidíte že sme to dali dohromady
1:09:40jaksi _m
1:09:41_e lidskou úvahou bez nějaký vzorečku fajn
1:09:45máme litický zápis tady toho signálu
1:09:48a pudeme dál
1:09:51_e
1:09:54spočítejte energii signálu
1:09:57staženou na jeden vzorek
1:09:59jak se to dělá
1:10:05jo
1:10:06všecky vzorky na druhou a když to má být stažené na jeden vzorek když to
1:10:10tady takhle říkám explicitně tak
1:10:13tak asi podělíme počtem vzorků že takže kdyby někdo chtěl ochromovat
1:10:17tak dokonce můžeme napsat _e nějaký vzoreček že jo S rovná jedna lomeno N
1:10:23sumu X na druhou N
1:10:26_e do té sumy můžeme dat třeba žena pojede vod nuly do jedenácti
1:10:32a kolik to asi tak bude
1:10:36zkusme si psát nějakou taštičkou tady hodnoty na druhou tak nula bude asi nula to
1:10:41je jasný kolik je nula celá sedum set sedum na druhou
1:10:46bacha macho
1:10:48jedna polovina jo nula celá sedum set sedum je
1:10:51pokud se to dobře pamatuju jedna lomeno odmocnina ze dvou
1:10:56jo takže tady to bude _e jedna polovina to nebude jednička jedna polovina nula
1:11:02na polovina jedna polovina víte že tam nepíšu žádný záporný znamínka protože to je na
1:11:08druhou jedna polovina shrábnu tavidlem a
1:11:13_e ráz dva tři a raz dva tři čtyři pět šest
1:11:18tři plus šest _e polovin je tři a tři
1:11:23to bude asi tak šest
1:11:25ne
1:11:26zkontrolujte mě prosím vás
1:11:28já jsem taky vyčerpali na konci semestru
1:11:32takže šéf děleno dvanácti
1:11:34a _e budeme mít tedy energii staženou na vzorek jedna polovina byl zatím nám to
1:11:40de úplně krát
1:11:42_e teďka
1:11:46spočítejte průchody nulou nejprve pohledem a potom matematicky
1:11:52tak pohledem na obrázek budu mít těch průchodů nulou kolik
1:11:57no a nebo taky dva podle toho jestli se tady ten první
1:12:01jestli ten první počítá že jo _e to je otázka rozhodně tady ta funkce prochází
1:12:06nulou tady prochází nulou
1:12:09takže
1:12:10_e
1:12:12dobře za třetí
1:12:15průchody
1:12:17dva nebo tři
1:12:21teď K V si to poďme zkusit spočítat také můžete jak by to počítalo nějaký
1:12:26_e algoritmu
1:12:27a _e průchodu nulou sme měli takový _e
1:12:32postup že sme brali jednu polovinu
1:12:36sumu
1:12:37muselo se jít od jedničky až do konce signálu
1:12:41a teďka pozor teďka tam byla L _e znaménková funkce signum
1:12:46_e vzorku
1:12:47současného
1:12:50mínus signum
1:12:52vzorku minulého
1:12:57a tady tohle celý bylo uzavřených absolutní hodnotě
1:13:01tak to vypadá hrozně _e hrozně vědecky
1:13:04_e poďme si pots ten signálek který tady máme návrh nahoře
1:13:10namalovat takové absolutní hodnoty
1:13:13a asi by bylo dobrý si dodefinovat absolutní hodnotu nuly
1:13:18protože nulou to nebude úplně dobře fungovat _e rozhodneme že nule kladný nebo záporný číslo
1:13:28kladný tak jo
1:13:30dobrý nula jeho teďka kladný číslo
1:13:33tak _e ty _e Í signál nebo _e nebo absolutní hodnotu teda v _e pana
1:13:40znaménkové funkce budou tady jedna
1:13:44jedna
1:13:45pořád ještě jedna mínus jedna mínus jedna mínus jedna
1:13:50jedna
1:13:51jedna jo tohleto je funkce _e signum leze signálový
1:13:57a teďka mě řekněte jak mám _e implementovat tady tu
1:14:02to je to děsně
1:14:03složitě vypadají ty závorku
1:14:07pojedu po signálu že
1:14:09vždycky se zastavím nějakým vzorku N kouknu se doleva
1:14:14a odečtu od sebe ty dvě vedle sebe sedící hodnoty znaménka
1:14:18a volbu je to hotový to znamená mám je T vodsaď
1:14:22_e jednička mínus jednička je nula tak se přesunu dál jedna mínus jedna je zase
1:14:28nula pořád nula pořád nula teďka bacha kolik je to mezi tady těma dvěma vzorky
1:14:34_e dobře absolutní hodnotě dva bez absolutní by bylo mínus dva tak když už teda
1:14:41mám _e fungovat
1:14:43absolutní hodnotě tak dva
1:14:45tak by to bylo zase nula se pozor kolik
1:14:49zase dva že jo nula
1:14:51tak _e když si to sumu udělám
1:14:55tak mi to dá hodnotu čtyři
1:14:58podělím to hodnotou dvě
1:15:00a dostanu dva průchody nulou tady Ú P mám
1:15:06tak _e průchody nulou taky umíme a teďka to začne bity v ostřejší protože máme
1:15:12udělat L P se analýzu řádu dvě to znamená máme spočítat _e filtr
1:15:23_e Z nebo jedna lomeno a ve
1:15:26který by tady tenhle _e tenhle signál
1:15:29dokázal namodelovat
1:15:33tak _e schválně ještě předtím než takový filtr začnem počítat
1:15:38když to bude filtry jedna lomeno A Z jo
1:15:41a máme ho určit jako druhého řádu to znamená
1:15:45_e že bude mít dva póly zkuste si tipnout takhle jako jak ten filtr asi
1:15:51tak bude vypadat kde bity poli tak třeba mohli bejt
1:15:59jo trochu poradím _e když máme _e když máme řečový signál
1:16:12jo ten řečový signál má takovéhle _e
1:16:16jaké spektrum kterejma prostě
1:16:20nějaký základní tón a tady má jedno rezonanci
1:16:24první formant druhý formant třetí formant
1:16:28tak pokud to modulem _e takovýmhle filtrem jedna lomeno A Z
1:16:32tam většinou najdeme
1:16:34poli
1:16:35_e které budou odpovídat prvnímu formantů potom nějakej pár půl který by odpovídaly druhýmu formantů
1:16:43potom někde možná pár půl který byl povídali
1:16:46tomu třetímu formantů tak jak myslíte že to bude tím naším signál k M
1:16:50_e žádnej základní to na žádný formanty nejsou že jo je to vobyčejná sinusovka
1:16:55na druhé straně ten filtr kterým to bude modelovat extrémně prostinké A
1:17:01jenom ten dva póly
1:17:04tak
1:17:05co myslíte kde tak asi budou
1:17:15tak
1:17:16dobrý nevíte
1:17:17někde budou
1:17:19přijdeme na to kde budou a možná že to potom začne dávat smysl
1:17:24_e dobrý tak _e že máme ten _e mám provést otestuje analýzu
1:17:30řádu dvě
1:17:32a abychom udělali takovou rotace analýzu
1:17:36tak _e my musíme mít k dispozici autokorelační koeficienty musíme mít dispozici R nula
1:17:44tedy jedna a R dva
1:17:47ty se dají docela nějaké D soustavy rovnic o dvou neznámých
1:17:52a ste mě potom vypadnou koeficienty A jedna Á dva
1:17:57a já potom může napsat _e filtr který _m _e je A Z
1:18:03jedna plus A jedna
1:18:06Z na mínus prvou plus _e dvě na mínus prvou _e na mínus druhou a
1:18:12takovýmhle filtrem se ten signál dál namodelovat když do toho filtru pošlete nějakým bobiči dycky
1:18:17buzení jako třeba jednotkový impulz
1:18:21a pak _e ten jednotkový impulz zas ne tak by vám ten filtr měl odpovědět
1:18:26signálem který odpovídá tomu co _e co modeluje jo tak uvidíme
1:18:32jak to dopadne jestli se podaří takovou kosinusovku filtrem druhého řádu na model
1:18:38tak _e věc první je
1:18:41že budem potřebovat _e asi _e autokorelační
1:18:45koeficienty
1:18:47tak _e
1:18:50co takhle nultý nebo obecně
1:18:54autokorelační koeficient
1:18:56se píše takže bych měl projet _e
1:19:00celým signálem
1:19:02a _e měl bych _e vždycky vynásobit
1:19:08signál
1:19:10N si ho posunutou variantou
1:19:13vo _e voka vzorku jsem říkal že jako první budu potřebovat
1:19:18autokorelační koeficient R nula
1:19:21tak u té hranolky
1:19:22to bude jak pro C
1:19:24_e takhle sem jiný člověk takže za přemýšlíme jestli už ho náhodou někde nemáme spočítali
1:19:35_e ten výkon jo ale bacha z _e tady se nám to trošku liší byla
1:19:40máte pravdu pane kolego pokud vlastně ten signál neposlouchá neposouvám
1:19:44pokud je _e káčko nula tak prostě plácam stejný vzorky na sebe a roznásobím N
1:19:51ten samý s tím samým makra tady nemám tu normalizační konstantu
1:19:54jo to znamená bude to ten _e nenormovaná energie nebo o prostě tady ta šestka
1:20:00to bude
1:20:02jo takže R nula _e ve spočítání rovná se šest
1:20:07pro ty pro který to bylo moc rychle tak je to prostě suma vod nuly
1:20:13do N mínus jedna
1:20:15X N krátkých N
1:20:17což není nic jinýho než S každýho vzorku vezmu _e druhou mocninu a mám to
1:20:24tak teďka _e ten autokorelační koeficient R jedna
1:20:32ten vznikne jako X N _e X
1:20:36N plus jedna
1:20:39takže si budeme muset _e vzít ten náš signálek a posunout ho
1:20:45_e v o jeden vzorek říkám doleva nebo doprava
1:20:55doleva ale ono je to jedno že jo protože
1:20:58jestli ho posouvám do jednoho doleva nebo doprava
1:21:02to je mě celkem fuk
1:21:04ono to totiž
1:21:05pokaždé vyjde úplně stejně jo takže tady tento signál no moment X do možná nakreslím
1:21:10o něco slušněji
1:21:12_e tento signál
1:21:15posunu
1:21:17o jeden vzorek doleva že to bude takhle
1:21:22_e
1:21:36tak a zkusíme si počítat ty vzorky které jsou nad sebou
1:21:40a psací kolik _e kolik jinde
1:21:45tak tady je
1:21:46toto mě nezajímá tady se to násobí nulou to je taky vpohodě tady mě vyjde
1:21:51_e nula celá sedum set sedum
1:21:56takže
1:22:00nula celá sedum se sedum víte co udělám tak v hospodě o budeme po to
1:22:03dá dělat takhle čárky prostě
1:22:05_e dá další vzorek bude _e tenleten taky nula celá sedum se sedum tak další
1:22:11čárku
1:22:15tady bude nula tak to nic nula celá sedum se sedum dalších čárka či bude
1:22:22nula celá sedum další čárka tady nula celá sedum set sedum a nula celá sedum
1:22:28se sedum tak to bylo docela dobrý
1:22:31protože jsem zjistil že to bude šestkrát nula celá sedum set sedum
1:22:40_e kolik to je
1:22:42se budou se podívat do řešení to že moc složité
1:22:46čtyry celé dvacet čtyři dobrý
1:22:54tak _e
1:22:56a teď by to chtělo eště R dvojku
1:23:06no a tam bych ten _e signál měl posunou
1:23:11o dva vzorečky doleva
1:23:14takže pojďme na to
1:23:17nula
1:23:19nula sedum set sedum
1:23:21jedna
1:23:22no sense
1:23:23sedum
1:23:25_e
1:23:26no a
1:23:28mínus nula celá sedum s
1:23:30sedum
1:23:31mínus jedna
1:23:35mínus nula celá sedum s
1:23:37nula
1:23:39takle
1:23:41dle
1:23:42a
1:23:43takhle
1:23:45tak a
1:23:46tak _e poďme se zase započítat
1:23:50všude samý nuly tady to bude nula celá sedum set sedum na druhou to je
1:23:53jedna polovina
1:23:54takže jedna polovina
1:23:56budeme si k ní dělat zase čar K hospodě
1:23:59_e
1:24:00další polovina
1:24:03a není
1:24:05další polovina
1:24:08tady nic další polovina
1:24:11tady nic
1:24:13a
1:24:14další polovina tak je možný že to je pět polovin
1:24:19prosím
1:24:21a
1:24:23no jo
1:24:24máte pravdu děkuju mockrát takže znova
1:24:29to bylo tak soborský jo _e vektory
1:24:33červeně budou značit kladný poloviny a modře budu začli záporný poloviny jo
1:24:39op
1:24:44op
1:24:45a
1:24:47no bude ještě tepla
1:24:49_e řeky tesla modrá studena tak je to asi teda plus jedna polovina
1:24:59naštěstí máme k dispozici referenční řešení
1:25:03jo
1:25:04výborný
1:25:06tak a teď prosím máme řešit takovoule soustavu rovnic
1:25:10kde _e vlastně do
1:25:13levé matice koeficientu
1:25:16dosadíme nula jedna nula
1:25:20pak sou tam _e
1:25:21hledané hodnoty koeficienty A jedna dva
1:25:25a na pravé straně jsou _e mínus autokorelační koeficienty tady jedna
1:25:32R dva
1:25:35tak teďka tady tohleto soustava rovnic se dál vyřešit
1:25:40_e asi vás matematice učili
1:25:43nějaké metody jako metodu kofaktorů a podobně já jsem se na ně když jsem vyráběl
1:25:48tady tohle za D toho řešení nemohl vzpomenout access byl pěkně ručně odvodil
1:25:53a _e kdybychom to počítali tak prostě dostaneme jako řešení
1:26:00nějaké hodnoty koeficientů mínus jedna celá dvě stě devadesát sedum a dva se rovná nula
1:26:05celá osumdesát čtyři _e zatím to berte tak
1:26:08že _e že běžným řešením soustavy rovnic
1:26:13o dvou neznámých nám tady tyhlety hodnoty vyšly
1:26:17já si tady schválně zkopíruju
1:26:19vysloveně kde měli protože
1:26:22je to nebudeme _e to nebudem řešit obyčejnými
1:26:27obyčejným zadáním
1:26:30ale neobyčejnými
1:26:32pomocí
1:26:34levinsona darby
1:26:47tak _e tohle to vyšlo standardním postupem
1:26:51ovšem my máme za úkol
1:26:54_e použít _e pro tento výpočet _e metodu pánů levinsona dá by na která vlastně
1:27:00iterativně zvyšuje krát _e zvyšuje krát
1:27:06prediktoru dycky v o jedničku
1:27:08a dopočítává koeficienty toho příslušného prediktoru teda ne délky to znamená my začneme na prediktoru
1:27:16řádu nula
1:27:17co si myslíte že _e že prediktoru řádu nula
1:27:22který Z
1:27:24nula předchozích vzorků
1:27:26má předpovídat současný vzorek
1:27:30dyž nemáte žádnou informaci a máte předpovědět co se teďka co bude tento vzorek
1:27:37a máte teda jako
1:27:39aspoň ponětí vo tom že řečový signál by neměl by stejnosměrnou složku tak jaká je
1:27:43nejlepší předpověď
1:27:45nula správně
1:27:46_e
1:27:48když byste měli
1:27:52dyž my sme měli prediktor
1:27:55řádu jedna
1:27:57to znamená předpovídali sme z minulýho vzorku
1:28:00tak tam _e
1:28:02si myslíte že by to bylo jaká předpověď zhruba
1:28:07tak ten samý no dvojnásobná hodnota tady vám z hlavy neodpovím zase to spočítat uvidíme
1:28:12jo
1:28:14a _e když _e budeme předpovídat pomocí dvou vzorků
1:28:17tak už budou mít koeficientíky Á jedna Á dva který si optimálně na ladím tak
1:28:23jak _e tak jak mají být
1:28:26tak poďme se podívat na to jak ta _e metoda těch dvou plánu
1:28:30vypadá
1:28:44tady tohle dycky vypadá jako strašně složitě jo tady prostě jako _e takový balík rovnic
1:28:49který nikdo moc nechce rozumět
1:28:54tak
1:28:55to pojďme ukázat
1:28:57když to není zas taková
1:28:59to není zas taková hrůza hrůzoucí
1:29:04no
1:29:06no
1:29:13_e dobrý
1:29:16jedeme prosím
1:29:18je tam na trošku vidět aspoň rovnice
1:29:20vidíme jo
1:29:22_e jedeme
1:29:24nebo to mám ještě zvětšit klidně
1:29:27tak jo
1:29:31tak jedeme o T prediktoru řádu nula
1:29:35který nám vlastně říká když budu předpovídat takovýmhle prediktorem
1:29:40to téčko znamená energií chybového signálu do jaká bude energie toho signálu které jsme řeknu
1:29:47schválně kolik myslíte že to bude pro prediktoru řádu nula
1:29:54když nevím nic nebudu říkat pořád je nula odhad je nula odhad je nula
1:29:59pak otto odhadů budou odečítat ten skutečný signál
1:30:04a budu počítat jeho energii kolik to bude
1:30:09tomto vole nultej autokorelační koeficient že jo protože _e prostě to bude ten původní signál
1:30:14který nebude vůbec nějak změněny
1:30:18jo takže _e
1:30:22tomto případě _e nula se rovná nultý autokorelační koeficient tedy šest
1:30:29_e další počítání
1:30:32je _e počítání vlastně nejvyššího koeficientu
1:30:39_e
1:30:40prediktoru
1:30:44řádu jedna jo takže poďme
1:30:49ne na to
1:30:51tady si _e
1:30:53tady si nastavím T se rovná jedna
1:30:57a počítám teďka prediktoru řádu jedna jo to znamená jeden koeficientík který bude
1:31:03násobit minulý vzorek aby z něho dostal nebo předpověděl ten _e ten současný vzorek
1:31:09a metody hrozně složitý _e vzorek
1:31:13který mě říká jedna se bude rovnat mínus dlouhá vošklivá za rok závorka
1:31:19autokorelační koeficient jedna
1:31:23plus
1:31:24a teďka suma _e ale u té sumy si prosím pozorně prohlídněte její meze vono
1:31:29to jede vod jedničky
1:31:31do Í mínus jedničky takže do nuly to znamená že tady tato _e suma nebude
1:31:37mít vůbec žádný členy
1:31:39takže tam nebude
1:31:41jo takže suma
1:31:43bude nic
1:31:46lomeno
1:31:47_e je mínus jedna
1:31:50a to je předchozí hodnota kterou sem _e kterou sem měl tady takže
1:31:56šestka jo
1:31:57takže si pěkně dosadím
1:31:59a bude to hodnota čtyry celé dvacet čtyři
1:32:06mínus čtyry celé dvacet čtyři
1:32:09děleno šesti
1:32:13a
1:32:15to bych to tady doufám mám někde spočítáno
1:32:22mínus nula celá sedum set sedum zajímavá hodnota že jo
1:32:32jo takže mám prosím vás teďka spočítaný prediktor
1:32:35_e prediktoru řádu jedna
1:32:38ještě tak _e takovou taková lipova poznámka když bych trestním predikoval tak tady ten koeficient
1:32:44_e tam bude s kladným znaménkem nebo se záporným
1:32:53jo i intuitivně prosím vás višně pojede nějaký signál pojede mě sinusovka
1:32:58a říkám mně to že _e současný vzorek toho minulýho dostanu pomocí hodnoty mínus nula
1:33:05celá sedum set sedum
1:33:07já by tam by se znaménkem je nutno plus
1:33:11já bych teda si tipnul že plus
1:33:14takže poďme se raději podívat _e zpět _m do přednášky
1:33:19jak že to vlastně bylo s těmi prediktory
1:33:23_e
1:33:28no tak skutečně do takže
1:33:31ten predikovaný signál
1:33:36je _e je tady tvořený vlastně filtrem jedna mínus A Z jo to znamená pokud
1:33:44bych vám chtěl _e takhle vopravdu vyrábět
1:33:48tak tam ten koeficient musí být se záporným znamínkem
1:33:52jo takže
1:33:53potvrzuje toto sme říkali já jsem tady měl návrhy jako že současný vzorek budete minulý
1:33:59nebo to bude polovina z minulýho nebo dvojnásobek minulýho
1:34:03tak to bude nula celá sedum se sedum minulýho a tady toto bude pro tento
1:34:07signál optimálního dat
1:34:09současnýho vzorku
1:34:10dobře tak poďme dál
1:34:12_e poďme to teďka prodloužit a poďme na prediktoru řádu dvě
1:34:19ji rovná se dvě
1:34:21ne pardon mi to ještě nemáme dopočítány omlouvám se
1:34:25tak _e do valili sme tady ten koeficient K jedna
1:34:31a _e
1:34:37z toho koeficientu K jedna vypočítám nejvyšší koeficient prediktoru řádu jedna akorát že vone tam
1:34:45jenom jeden chudáček
1:34:47takže _e to bude mínus nula celá
1:34:51sedum set sedum a je to koeficient a
1:34:54jedna jo nejvyšší koeficient první generace prediktoru kterej se vypočítá
1:35:01takže _e jedna
1:35:03jedna
1:35:04bude
1:35:05mínus nula celá sedum set sedum
1:35:08tak teďka tam máme zase rovně složitý vzorec
1:35:12prosím na výpočet dalších koeficientu tady tohodle filtru
1:35:17sou nějaký
1:35:20nejsou pořád je jedna já jsem počítal koeficient jedna žádný další sany další nemusím
1:35:27poslední věc která mě zbývá je tady ten závěr kdysi pro tenhleten hřát prediktoru spočtu
1:35:33chybu výslednýho _e že teda energii výslednýho chybový ho signál
1:35:40jo takže C jedna
1:35:42rovná se
1:35:44jedna mínus
1:35:45_e teďka tam bude nula celá sedum se sedum na druhou
1:35:51Z té předchozí energie krát šest
1:35:55takže to bude _e jedna mínus jedna polovina krát šest tedy tři
1:36:01jo dokázali bychom si skutečně ten signál chybový vypočítat
1:36:06a vyhodnotit si tady tuhletu energii chyby a zjistíme že oproti minulým u se nám
1:36:12dvakrát zmenšila to je docela úspěch jo prostě pro úplně blbý prediktor který neumí nic
1:36:17ten který odhaduje jenom z jednoho minulýho vzorkovat dvakrát nižší chybu _e slušně
1:36:22tak poďme dál
1:36:25poďme na _e Í
1:36:27rovná se dva
1:36:30tak _e
1:36:33zase počítáme hodnotu K Í která je
1:36:37mínus
1:36:39_e
1:36:41R dva
1:36:44víte co já tam o tom budu ty rovno ty hodnoty rovnou psát
1:36:48takže mínus _e R dva
1:36:51to bylo nula celá a
1:36:53pět
1:36:59tak teďka je tam vošklivá suma
1:37:02a pozor ta suma už teďka nebude prázdná ale to bude obsahovat
1:37:07obsahuje vlastně _e si
1:37:09koeficienty prediktoru s předchozí generace že jo
1:37:13toto sem vypočítal tady
1:37:16a já to mám jenom jedinej
1:37:18a ten je mínus nula celá sedum se sedum a lehčího budu násobit
1:37:25jednu sumou vo ty jedničky do
1:37:30dva mínus jedna tedy zase do jedničky
1:37:34jo takže jedinej člen sumy bude pro je se rovná jedna
1:37:38tady je dva mínus jedna
1:37:41takže by měl násobit _e autokorelační koeficient R jedna
1:37:46to _e by to mělo být
1:37:50mínus nula celá sedum nula sedum
1:37:53krát _e autokorelační koeficient můj drahý
1:37:58N jedna bylo čtyry celé dvacet čtyři
1:38:02čtyry celé dvacet čtyři
1:38:05_e děleno
1:38:07předchozí energií a ta předchozí energie dva tři
1:38:12tak tady tohle kdy se na možná z hlavy počítalo trochu hůře tak sedum podívám
1:38:16do reference
1:38:18do to bude
1:38:19za to bude dobrý
1:38:21a měl by to být nula celá osum tři
1:38:29_e tím pádem sem vypočítal
1:38:33tenhleten chlíveček
1:38:36_e
1:38:38nejvyšší
1:38:40koeficient tohodle řádu prediktoru kterej bude nula celá osum tři
1:38:46a musím k němu dopočítat ještě ty který mě chybí a chybí mě jediny
1:38:51a to první koeficient tady tohodle prediktoru jo to znamená
1:38:55teďka _e počítám s prediktoru téhleté délky koeficient a jedna
1:39:01a podívám se jak že to má být no je to ten _e toho samýho
1:39:05čísla z minule generace tedy a jedna
1:39:10kdy by měl být tady tenhle
1:39:13_e že rovná se mínus nula celá sedum set sedum
1:39:17a eště _e musím vzít
1:39:20ten současný koeficient kálí který sem teďka vypočítal takže nula celá osum tři
1:39:28plus nula celá
1:39:30osum
1:39:31tři
1:39:32krát to
1:39:36dva
1:39:39mínus jedna
1:39:41je jedna
1:39:42dva mínus jedna takže zase
1:39:44ten sami
1:39:46ten samý koeficient _e
1:39:48z minula
1:39:52mínus nula celá
1:39:53sedum nula sedum
1:39:55_e kdybychom potom počítali _e prediktory vyšších řádů tak byste viděli
1:40:01že vlastně tady
1:40:03tenleten tahleta část výrazu je zodpovědná za to že bereme _e že bereme
1:40:12vždycky
1:40:15no
1:40:16jak to říct že pro výpočet jezdí ho koeficientu to znamená koeficientech který počítám jedu
1:40:21vodspoda nahoru a tady
1:40:24tato část indexování mínus jemně spolu způsobuje že jedou vlastně z těch starej koeficientech shora
1:40:29dolů
1:40:31jo ale teďka to nemusíme řešit
1:40:33_e mám
1:40:35tady tento předpis pro výpočet _e
1:40:39druhýho koeficientu a mělo by to být mínus jedna ceva
1:40:43dvě stě
1:40:45devadesát pět
1:40:49mínus jedna celá dva mezi pět
1:40:52jo takže prosím tady zastavíme
1:40:55u levinsona darby na by to bylo všechno jenom se podíváme se jsme spočítali ty
1:41:01samý hodnoty jako je jako prostým řešením soustavy rovnic o dvou neznámých
1:41:06spočítali
1:41:08oukej
1:41:09jo takže
1:41:10prosím teďka máme k dispozici filtr
1:41:13který nám vlastně modelujete náš signál
1:41:17a ten filtr
1:41:19bude následující bude to _e Z
1:41:22se rovná jedna lomeno
1:41:25_e
1:41:27jedna
1:41:32plus
1:41:33jedna celá dvě stě devadesát pět
1:41:36Z na mínus prvou
1:41:39_e
1:41:47moment
1:41:48sorry mínus
1:41:53plus _e nula celá
1:41:56osum tři
1:42:00Z na mínus druhou
1:42:03tak _e
1:42:05kdyby co kdybysme chtěli _e toto je filtr který bychom použili vlastně modelování řeči lze
1:42:10kdybysme chtěli udělat prediktor
1:42:13tedy větu řeč bral pro ustála predikoval skutečně z těch minulej vzorku
1:42:19ten _e ten současnej dokázali byste měřítek jak by vypadal ten
1:42:26jo tady je to je prostě řeč
1:42:29tady mám vyleze prý predikce
1:42:34a aby chtěl vědět jak to bude vypadat
1:42:37tak _e
1:42:40asi by to mělo
1:42:42byly tam dvě zpožďovací
1:42:45linky že jo
1:42:47dva zpožďovací o budky
1:42:59tak tady s toho pole za predikce a mně teďka řekněte co mám napsat s
1:43:02tím trojúhelníčku
1:43:14bacha nekreslím strukturu tady tohoto filtru jo tento filtr by byl jakej T jíra nebo
1:43:20sýr
1:43:22toto by byl here
1:43:24teďka sem nakreslil sýr
1:43:27který by měl jenom predikovat
1:43:31dyž to vezmu podle přednášky tak tady tenhleten fire by měl být jedna
1:43:37_e mínus
1:43:41o pardon to je tedy _e ten filtr by se měl jmenovat podle mě jinak