co bude dnešní přednášce

dodělání velké v úvodu obsáhlého

_e kde vlastně představuju jednotlivé technologie tak je pokud s kostce a na pěkných obrázcích

a populárně

a potom se podíváme už do takové tuší věci a bude to vlastně průlet T

číslicové zpracování signálu aby se to shrnout jako isosceles kostce

jo takže _e teď to bude taková pohodička a ve druhé části přednášky to bude

možná ne pohodička

ale na druhé straně jako když člověk potřebuje se zvukem řeči nebo jist lidem něco

dělat prostě musí počítat

takže razení dělat poďme do toho

_e

na minulé přednášce na tom úvodu sem vám popovídal tedy o těchto budící dneska se

podíváme

odch identifikace jazyka dál

takže _e když _e

potřebujete teda jako zjistit tady mám ste krásnej krásného brázdičky jakým jazykem se mluvilo

tak _e máme vlastně v k dispozici takové dva základní přístupy které se po světě

používají a první přístup je akustický a druhýmu se říká von o takticky

vlastně se akustice pokud ještě trochu něco pamatujete z minulé přednášky

v _e nějaký gaussovským o daleko o tom že se do těch dosovský modelu vlastně

pošlou ty naše velké matice parametrů tak ten _e akusticky přístup funguje úplně stejně to

znamená na jeden jazyk

ale prostě jeden model který je tvořený spoustou _e spoustou gaussovek

ten nebo dal model na tróne na trénujeme na co nejvíce datech _e s toho

daného jazyka

a pak prostě když máme těch modelu několik pro češtinu pro čínština nevím ještě P

proto dalšího tak do všech modelu vlastně pošleme _e tu stejnou maticí parametrů a jenom

si

řekneme jak moc nám to je který model pálil

srovnáme co vybereme nejvyšší číslo řek ale ten jazyk to je

u toho von o taktického přístupu je to _e trochu jinak

_e už toho názvu vám bude zřejmý že se bude jednat osivo nějaké fonémy

a vo nějaký prostě

když máte taktiku tak je to vlastně na sledu nějakých událostí že jo tak to

tam bude taky

je to vlastně

takový líbí V název pro počítání statistik jednotit dvojic a trojic fonému které se následují

_e za sebou a s toho ste schopni jako na který detaily za chvilku

takže _e ten

_e podívám sto mám dete a

detaily tam nemám za chvilku tak možná víc _e více detailů tady

takže _e u toho fantastického přístupu

to máte jako vlastně první

_e jako první bloček je tam samozřejmě k extrakce příznaků toto děláme úplně všude to

už bych ani nemusel zmínila

druhý je tady ten mozek to je hrozně hezký obrázek který vlastně ty sekvence příznaků

má _e má přepsat sekvencemi nějakých hlásek _e fonémů

tak

teďka se vo tom jako zkusme chlup obavy

_e představte si že má moc sebe z rozpoznávat _e

hongkongskou čínštin úvod mandarinky _e češtiny _e obvod tcha ionské češtiny

a nikdy jsem neviděl žádný trénovací data prostě přepsanej pro češtinu to že si neumim

udělat čínskej fonému ve rozpoznávač

myslíte že to mám rovnou zabalit ale už to bude nějaký a

relevanci mě nabídli sto tisíc dolarů když takovej

rozpoznávač udělám artroskopy tady že nechcou nebo

nebo něco

tak uvědomte si o to co tady jde v tom fonetickým přístupu _e vlastně máme

tu vstupní řeč přepsat do nějakých sekvencí jednotek

ale _e

já to mohl jazyků ve skutečnosti nemusí vůbec rozumět jo když prostě je _e mandarinky

_e čínštině

_e

ten procent tak

hrozně jako _e častý a ten znak se _e vyslovuje

_e svolán

_e J u

že jo u

a ta je v antitěžišti ně bude zase

hrozně častý tady tento znak

a ten se bude _e vyslovovat _e

_e chůvo _e C

ta ho

tak já jsem _e teďka udělal co když sem vám říkal tady tyhle

je krásný slova

že by si že umím čínsky

abych hrozně na tom já neumím takže já jsem vlastně na jejich reprezentaci voni to

ti _e číňani a charváty skutečně takhle nějak řeknou ale já jsem vlastně tady tyhlety

slova

nějak vyslovil pomocí vobyčejnej českej fonému který umím

a úplně to samý vy můžete udělat _e číslo taktickým systém jo to znamená na

místě tady tohoto nemovi horký rozpoznávače prostě použijete nějaký který máte k dispozici nemáme samozřejmě

nejoblíbenější český

_e kterým máme doma který jako známe ale taky násobíme si třeba maďarský fonému vy

rozpoznávač

nikdo z nás maďarsky neumí ale natrénovali z mého na nějaké standardní maďarské databázi a

zjistili jsme že když se zapíchne do takového ale systému pro rozpoznávání jazyka takže prostě

úžasný a může se čtyři roky spekuluje ne pro

možná že to je protože se maďarštině _e ten _e ta databáze prostě má nadefinovaných

mnohem více fonému neštěstí měl řečníka máme asi třicet devět

jestli se nepletu tak maďarských jestli šedesát a možná že to tou bohatostí fonémů že

prostě jako nám pomůže znáte popsat ostatní jazyky no takže tímhletím rozpoznávač M

prostě

_e data těch vašich jazyků já nevím tady bude mandarinky tina tady bude _e tady

manštin a přepíšete dostanete takovéhle dlouhatánský je několika limitu milionové řady fonému

ale těch zadá fonému potom spočítáte statistiky spočítáte statistiky každýho jednotlivýho symbolu to znamená uděláte

si tabulku kde bude a někde bude na někde bude J

potom se počítají statistiky dvojic fonému tak zvaný bigramy a pak se počítají statistiky projít

fonému

tak zvaný trigramy jo to znamená zjednodušeně řečeno máte ke každýmu jazyku tři tabulky v

jedné soubory gramy druhé bigramy ve třetí trigramy

tomuhle jazyku je máte taky a potom vám přijde nějaký _e neznámý signál

a vy si ho přepíšete zase tím po nebojím rozpoznávač M který máte takže to

bude třeba

_e chůvo

co

no

a teď toho _e foném ového řetězce

vyberete jednotlivý znaky

podíváte se do tabulek pro jednotlivý jazyky jaký mají tady tyto znaky předpočítaný pravděpodobnosti to

vám dat jedno skóre pak se tam podíváte na bigramy

druhý score podíváte se na trigramy třetí score a

zjednodušeně prostě který s těch jazykových modelů nebo tak zvaných von o taktický modelu pro

který jazyk tam bude víc bečova tady s těmahle testovacím a data má tak ten

prohlásíte prostě že je dobrý a že vyhrává

a že tenleten jazyk se nám rozpozná jo takže todleto je princip vono taktický ho

přístupu

který se taky rozpoznávání jazyka velice používá a je

docela dobrý je že většinou komplementární tím akustickým

takže když se výsledky tady těch dvou systému smíchají tak je to prostě lepší než

jednotlivé

_e

jo takže rozpoznávání jazyka tetě vlastně jako taková _e takový

poznámka k tomu na čem ty systémy pro rozpoznávání jazyka trénovat

potřebujete zjednodušeně mnoho nahrávek daného jazyka a k tomu mnoho bych ještě připojil že potřebujete

se z té cílové oblasti kterou je budete chtít rozpoznávat znamená pokud C budete takový

systém vybije vyvíjet

pro _e nějakou _e za nějakou armádu nebo pro někoho tak vás asi nebude zajímat

_e krásná řeč _e nějakých mluvčích nebo hlasatel u k televizi

ale potřebovali byste nahrnou co nejvíce prostě _e telefonních nebo v obyčejných hovoru pomocí

prostě ten styl řeči kterým lidi _e normálně mluví

tady v tom tímto jsme se zabývali

vlastně _e v jednom takovém projektíku bysme vlastně pomáhaly americké len když _e není byste

kdy ta konzorcium sesbírat nějaká data to evaluace _e těchdle těch systémů v roce dva

tisíce osum

adam toto dokonce jako přesile surface li nějaké peníze

ale šlo vlastně o to že my sme si řekli na světě spousta dat volně

dostupných které můžete stáhnout z internetu nebo se můžete napíchnout na satelitní vysílání a můžete

prostě během jediného dnem indispozici já nevím jako ti se tisíce hodin dat

akorát že ta data vám většinou nebudou k ničemu protože to právě jako

je to hudba jsou to nějací školení mluvčí hlasatele je tam pořád ten M ten

samý moderátor který tam dva stačí nějaká moudra takže _e jsme vlastně udělali takový systém

kde se tady tyhle těch dat napřed detekují telefonní hovory

a potom se prostě telefonních hovorů se něco trénuje když se ten mimochodem na detekovat

telefonní hovor rozhlasovém vysílání tak to docela jednoduchý protože se podíváte na spektrum

normální rozhlasové vysílání má prostě široké spektrum vod nuly snad až do osmi nebo do

deseti kilohertzů a když je v tom potom vidět ten telefonní hovor tak vidíte jasně

jak to spektrum dosahu jenom vodstvo od nuly do tři a půl kila nebo roste

čtyř kilohertzu už tam není

takže na základě vobyčejný stýho spektra se dá udělat poměrně pěkný detektor

a dá se s tím _e

tady tohle

tohle natrénovat

další věc samozřejmě že když máte takové nějaké _e přítelíčka i co tyhle telefonní hovory

sbírají

jo

my raději ani nevíme jak tak _e si to tihle ti přátelé můžou přímo do

trénovat na svých _e na svých vlastních dat

a naše současná práce v rozpoznávání jazyka je _e není to moc překvapující je to

úplně to samý co seděla rozpoznávání mluvčího to znamená boj nechtěnou variabilitou

jo my jsme si říkali že rozpoznání mluvčího vlastně chtěná variabilita jetá co rozlišuje jednotlivý

mluvčí všechno vostatní prostě co říkají emoční stav prostředí a taky jejich jazyk je špatný

a u rozpoznání jazyka

je to zase takže ten jazyk je důležitej a všechno ostatní včetně toho mluvčího je

spatny

jo takže pomocí úplně stejný ho _e matematického formalismu jako co sem vám tady předváděn

minule s nějakýma posouvacího nouzovka má

dokážeme bojovat jistou _e jistou _e inter řešení

_e a tentokrát inter speaker variabilitou rozpoznávání jazyk

tak to nebyl I D

pak _e máme přepis řeči na text troše jako taková takový ferrari _e zpracování řeči

prostě tom tento nejlepšího nejvíc super

co člověk může udělat

se budeme tady o tom mít

_e přednášky který se budou týkat nějakých jednodušších metod

_e dynamicky borcení času potom nějaký složitější hádanek poďme se podívat teďka jako úplně

úplně znaku na takový systém

mimochodem ještě když _e

když _e se budeme bavit o přepis řeči na text

tak uslyšíte po světě různých zkratky jako třeba ve dva T jako vojtu text

nebo S dva testy čtvrtek

odborných kruzích je asi nejpoužívanější ilwis je s _e to znamená lásky by velikán téměř

spíše konečný

rozpoznávání spojité řeči s velkým slovníkem a všechny tři jsou to sem sou to sami

jo

a teď se pojďme podívat jak tady toto sem _e sedí nebo jak se srovnává

s tím naším rozporům základním

rozpoznávací _m _e schématem

tedy jestli si pamatujete tak byl nějaký signál na vstupu výpočet parametru

modely nám hodí nějaký čísla

a na těch číslech probíhá výběr

výběr toho nejlepší

zjistili jsme že třeba v rozpoznávání pohlaví to byly tady si ti kluci a holky

co sem vám tady promítal minule tak to bylo extrémně jednoduchý tady případě existuje sanito

trochu složitější ale zase jako _e tam ty základní bloky uvidíme takže

tady nám do systému přiveze řeč

výpočet příznaku probíhal naprosto stejně jako u těch předcházejících aplikacích

to znamená nějaký vektory který nám týkají každých _e každých deset _e milisekund

a teď tady máme _e nějakou sadu modelu

a ta sada modeluje vlastně chod schovaná tak zvané rozpoznávací síti

tetě

čeho je ta rozpoznávací sítích _e zkompilovaná nebo _e nebo _e postavena

je postavena s akustických modelu

kde zase jako

nebudeme překvapeně když najdeme jimem K znamená modely do úsov kam a

a ty akustické modely na vlastně říkají

když _e

tady mám třeba

masku a ste vlasy hláska a

a tady mám akustický model pro áčko

tak ten model je tvořený nějakou prostě soustavou několika rozměrných gaussovek

a říká mně jak je pravděpodobný že tady tenhleten kousek signálu zrovna mohlo být káčko

jo potom tam bude mít samozřejmě model pro byl C D a tak dále a

tak dále to znamená

tady mi to vlastně dává jakýsi startuje kousek vstupní vlásky odpovídá nějaké hlásce

potom tam mám další komponent a _e to je jazykový model

jazykový model mi říka schválně zkuste při na to co

to může být návykový model

když řeknu prezident václav jak jestli bude další slovo

ale nebo klaus že jo tak to bude asi tak půl na půl asi to

jako nebude slovo jary

takže jazykový model vám dává přesně tady tohle vlastně na základě nějaké historie slov

která V nejčastějším případě býval boj slovní

tam udává podmíněnou pravděpodobnost

do že

tento okamžik bude pravděpodobný nějaký slovo

jo když si to představiteli můžeme mít

opravdu _e historii prezident

václav

a teďka tady budete mít _e klaus

havel

a jardin

a zjistíte že tohleto slovo podmíněný touto historií je pravděpodobný zhruba tak nula celá čtyrycet

devět procent tady tohle

zhruba nebo nula celá čtyrycet devět let taky nula celá čtyrycet devět

a tady to bude nula celá nula

nula jedna jo takže tady tyto hodnoty nám vlastně _e udává jazykový model a ještě

schválně značen takový jazykový model o čem to natrénovali

a čem byste odhadli tydlety pravděpodobnosti

tak

zkuste noviny správně

_e no noviny jsou docela dobrej zdroje víte že prostě nich jako giga seženete zadarmo

na internetu případně ještě víc když se nějaký koupíte _e

od lidovek nebo já nevím od koho

_e na co bude tenhleten řekli model kterej na trénujete na novinách dobře fungovat

a televizi na zprávy jo na rozhlas na zprávy a ná _e řeč která se

bude svým charakterem podobat tím textu na který ste kterých se trénovali

co takhle třeba přednášky na fitu

se pokoušíme dělat si pročesat com

jak by to bylo tam takový modelům kterým na trénujete na _e na nový na

žádná sláva jako prostě nebo nebude zná slova jako fourierova transformace

půlsemestrální zkouška a tak takový chudičký který tady je to máme _e máme rádi takže

u trénování těch jazykových modelu

vlastně _e nějaký obecný dokáže to jednoduše postavy ale potom by abyste udělali takový model

tak vypracoval dobře pro takzvaně indo main data znamená data dané domény kterou budete rozpoznávat

tak si musí teda trošku práci a sesbírat ty textový _e ty textový zdroje tak

aby seděli

tou cílovou doménou kde budete rozpoznal jo toto prostě se nám bude táhnul jako červená

nic

celým kurzem aby něco furt fungovalo tak by si musíte trénovat na datech který jsou

co nejblíž tomu co budete chtít _e potom zpracovávat

co takhle _e

eště pořád vás nenechám s tím jazykový model

_e

takový říkali model který třeba na trénujete na novinách a šli do něho na hrnete

všechny studijní opory fitu bude potom perfektně pracovat _e

na těch

obecných věta

na světa který obsahují tady naše informatický termíny to bude bezvadný

a co takhle

slova prostá nebudu tady říkat nebo toho že se člověk různě zadrhává a začíná jednu

větu čtyřikrát že se tam byste _e zaslechli čtyři krát za sebou a tak jsem

byste natrénovali tohle

přepis řeči správně

cokoli myslíte řekli přepis řeči stojí

hodně no

přepis řeči stojí tak jako melouna takovou menší databázi

naštěstí ná _e na _e spontánní data existují databáze který

se dají koupit

táhnout a něco možná kosovi přepsat byla to zajímalo

tak sme tady hodně dat se jako přepisovali nebo organizovali přepisují sami ale to vopravdu

šílená práce která

R a není věda která jenom otročina

která stojí spoustu peněz tak _e

poďme k tomu dalším bloku

a to je výslovnostní slovník co to je

co myslíte že musí výslovnostní slovník udávat

když výslovnosti že jo jako daná forma jednotlivých šlo

vedle toho musí být postavená fonetická forma protože

mám tady základní jednotky pro rozpoznávání který jsou fonémy a nebo nějaký fonémy kontextu ale

potom teďka nemluvme a musí mít nějakej převodník kterým a to ze slov _e dokážu

na fonémy pře ve

taktéž byste ten výslovnostní slovník vyrobili

zase

navrhujete

buď bodmer jednoduchým případě pro češtinu

já mám studijní oporu

i se selmo Y se stane

_e a chtěl bych i převést nechť ovlivní vybrat všechna slova převezte na fonetickou formu

jak na to

prosím

_e

to nevím jestli byste takovýho dobráka sehnali

nejenom přečte léky napíše op

tak další návrhy

tak buď ten slovník někdo už udělali filovo něho koupíte nebo řeknete nebo něco takovýho

asi nejjednodušší

nebo ho vytvoříte přesně tak jak řekl pan kolega to znamená že někdo zasedne opravdu

pro každý nový slovo foneticky zapíše jeho výslovnost

co takhle vymyslet něco chytřejšího

to takhle zkusit natrénovat nějakej převodník

psané formy na fonetickou

jo tak tady tohleto de

když se podíváte _e po netu

a dáte si tam _e dáte si tam zkratku se k vy tour

tak _e najdete

systém trénovat silný

který je založený na nějakých takzvaných join s máte krámech o těch teďka vůbec nebudeme

_e povídat ale tenleten systém prostě když mu předložíte existující _e výslovnostní slovník

na jedné straně psanou formu na druhé straně fonetickou tak se vám dokáže naučit C

pravděpodobnostně pravidla tak

že potom dostane nějaký neznámý slovo

znamená ne jiné dokopu koko

koná liší a dokáže vám vyhoví derivovat se fonetickou formu dokonce to dokáže nejen

pro jazyky s takovou rozumnou výslovností jako je čeština lancelot on když tím

tak a eště jedna možnost nám zbývá

o které sme tady nemluvili

ste navrhnout

jak udělat výslovnostní slovník

já sem vám rovně začal

možná že to jako někde D češtině byste vlastně možná že chcete říct ocel _e

to co vlastně _e řešení a to je napsat si pravidla

češtině třeba _e takovýdle pravidla pro většinu slov do u napsat protože čeština je fajn

téměř fonetický jazyk

prostě _e když _e máte slovo rozpoznávací

a přepíše toho do fonému tak zjistíte že je to téměř

zjistíte že to téměř fonetický zápis

jo a sou tam nějaký _e nějaký jevy nějaký fenomény jako že P

jako že já nevím _e že _e znělé D před neznělo ohlávkou nám přechází do

_e do S

ale na to toho dokážete pokud si vezmete knížku fonetice zase dokážete napsat pravidla

jo to znamená uděláte sadu pravidel

a nějakým způsobem nějakou chybovosti potom budou fungovat _e potom budou fungovat _e i na

neznámý slova

tak a když máte všechny tady tyhlety komponenty

tak se s toho dá zkompilovat tak zvaná rozpoznávací C a von jenom říkám zkompilovat

protože _e pokud prostě ste se děsili toho co vám tady vykládají pan profesor češka

medu know

_e a zvolená nemo konečných stavových automatech a mysleli takže si že může jako nikdy

nikde neuvidíte když tu zkoušku máte úspěšně za sebou takhle prostě přišlo z hračko

a _e za zase tady tyhlety věci

vidíme jo tyhlety věci je tyto komponenty

se dají normálně reprezentovat pomocí konečných _e stavových automatů který jsou _e samozřejmě narozdíl od

těch tiskových

_e vážený

jo vy tam

sto asi viděli prostě

F S a jako si my state automat on a nebo F S P

ceny state _e ten tým se a u těch našich jesliček dám ještě dycky V

takže to obsahuje pravděpodobnosti takže to wait i a pomocí _e takových operaci s těma

konečným a to vím automat a máte v strom a který jste viděli to znamená

nějaká kompozice determinizace minimalizace dokážete postavit takovouhle rozpoznávací C

pokud třeba půjdete _e _m

oni podíváte se po netu

_e budete se koukat po tu open F S T

tak tohle to je záležitost která tuším začal někde tritiem T dales a teďka je

to všecko pod úhlem

ale _e je to prostě sada úžasných pomůcek pro práci právě vážený malý nevařím A

konečným stavovým automatem

jo můžete

že se mrknu na to a to je asi tak jako dneska hlavní proud rozpoznávací

pro rozpoznávání řeči protože spoustu práce za vás můžou právě udělat konečný stavový automaty a

vy potom dostanete jako docela

malou a do paměti na co smrtelnou rozpoznávací C

se kterou s poměrně jednoduše dokážete rozpozná

tak abych se dostal k těm _e rychle s tím dalším dvěma blokům

tak _e ste rozpoznávací síti jednak uvidíme jednotlivý akustický modely

který nám dávají zase nějaká čísla a ta čísla vyhodnocují _e zdá na tomletom místě

v řeči bylo pravděpodobně _e nebo B nebo C nebo ne

a potom _e tam přicházejí dekódování a to je v tomhle případě o něco složitější

než jenom vobyčejný K výběr maxima který jsme viděli v těch minulých aplikacích a tam

sme třeba měli

_e modely deseti různejch jazyku

říkat zatím prohnali data ty modely nám dali nějaké

číslá nějaké likelihoody a my jsme vybrali maximu

a todleto bylo celý dekódování vobyčejný výběr maxima

_e při dekódování

rozpoznávání spojité řeči

je to tak že vlastně vám ten _e prostor hypotéz strašně způsobem bobtná

zásadní byste měli

vyhodnocovat pravděpodobnost toho že na libovolném místě v řeči je libovolné slovo

což prostě jako v životě nedokážete protože by se to nikdy nespočítali takže pak přichází

_e ke slovu takový

techniky je kopie prořezávání

pruning že jo pokuste někde slyšeli vo algoritmu i stále

jo jako _e prohledávání grafu tak tady tohle taky občas uvidíte časově synchronní časově nesynchronní

prostě jako můžete celý dvě přednášky strávit tím že budeme _e budem povídat ode kodérech

měli sme tady na konci

zimního semestru mirka nováka že místo myslím viděli ibm klastry

to jenom tak jako na tukwila

povídal tři hodiny

tak _e tohle jenom potomek příklad takové rozpoznávací sítě

která pokud si dobře pamatuju tak dokáže rozpoznávat slova Á a B

jo a V _e tuto slova a B můžou být _e můžou být nějaké _e

nějaké smyčce když budete mít takovou rozpoznávací síť pro nějaký reálný slovní

reálný slovník má pro angličtinu velikost _e zhruba padesát kilo slov jo s tím se

naposledy velice slušnej rozpoznávač

pro češtinu

je to tak více než tři sta kilo slov protože čeština je potvora o jedna

tak jako bysme to samozřejmě na to je jako na obrazovku nedostali

tak _e zase

trénování systému pro voice tu _e vojsko text

_e

akustický modely se musí trénovat na korpusu mluvené řeči

_e na nějaký textových předpisech

jo to znamená máme prostě na hraných spoustu věc

ne

nejsem

přišel

tomu je wavka

a abychom natrénovali ty akustický modely tak potřebujeme vědět že tady je téma se D

tady je na

tady je tady je F

a tak dále a tak dál

existuje snad jenom jediná databáze na světě kde _e tady

tohleto _e kde sou tady ty značky dělaný a načasovaný ručně a to sem net

limit jo

to databáze americké angličtiny

a tam jako vopravdu sedělo stádo fonetiku a označilo ručně kde sou který hlásky

běžně by se tady z tohoto všichni zbláznili takže co

těm databázím

máte většinou dispozici

souhlásky

a textový přepis a když potřebujeme trénovat nějaký akustický modely tak sis tohodle textový do

přepisu musíme _e vyrobit pomocí výslovnostní ho slovníku nebo v nějakýho pomocí _e nebo pomocí

automaticky objev into phoneme tool u

_e fonetický řady že prostě do N F S

a tak dále potom vím že tahleta věta obsahuje tyto fonémy ale nevím kde sou

a naštěstí když se trénují takový systémy pro rozpoznávání takto nemusím přesně vědět protože ty

trénovací algoritmy po několika _e po několika koleč tých si ty _e si ty

fonémy za rovnají sami

na jednotlivý řečový segment i když tady tohleto budete dělat a uslyšíte slovíčko fork alarmem

tak u toho furt elementu prostě máte k dispozici forem _e řetězce fonému máte k

dispozici masku nějaký modely

a tím modelům řeknete já vím že sou _e mojí promluvě tady tyhle fonémy ale

nevím kde

a ono vám to automaticky zrovna

tak _e co je docela problém je tady fonetická sada

a výslovnostní slovník

protože to musíte mít _e to musíte mít jak sme říkali jako nějak předem definovanou

_e textový korpus tak jak jsme tady s kolegy dali dohromady zase až tak _e

cache tak _e důležitý a složitý není jenom musí do za pozor aby byl _e

ste domény kde chcete něco dělat

tak a my se tady snažíme v rámci nějakého projektu

trošku zjednoduší tady ten postup _e a

pracovat na technika

který by dokázali

i vlastně pro nový a neznámý jazyky

_e

se obejít best _e fonetické sady abych výslovnostní ho slovní

jo tady tohle docela zajímavý protože

jako skupina dostáváme občas požadavky udělejte nám rozpoznávač pro nějaké úplně divnej jazyk

a říkám jako a máte

v tom co to jazyka máte no máme nějaký nahrávky aby jsou nějak přepsány

no

a znáte jako nějakýho fonetika to říkat ne

mates výslovnostní slovník jazyka ne máte nějaký texty _e možná takže _e řekl je to

do je to docela důležitý

pro rychlý vývoj dej takový v aplikaci do nových nebo do nových jazyků nebo i

do třeba velkých jazyků D tady tyhle zdroje nemáte k dispozici jo třeba jsme se

dívali na thajštin u eště nemá si osmdesát milionů mluvčí

a když se chcete koupit nějakou thajskou databázi tak prostě máte smůlu protože žádná není

tak

poďme se podívat na _e etapu detekce klíčových slov

tak co to znamená

znamená to že řeknete já nechci přepsat celou nahrávku

ale máme nějaký klíčový slova když byste měli třeba online zpracování meetingu

tak to může být třeba slovo rozpočet jo nebo vyhození šéfa nebo něco takovýho a

potřebujete aby vás ten systém upozornil na tihle na místě kde se takový klíčový slova

_e objeví

tak _e jak se na to de

v zásadě

můžete _e

budete aplikovat úplně zase stejný schémátko kterým sme tady několika několikrát viděli

jestli si pamatujete na rozpoznávání mluvčího tak jsme tam měli dobrej model dobrej model _e

vlastně vyhodnocovalo že to je ten daný mluvčí

a pak sme tam měli špatný modelům říkali jak obliga modul

a ten vyhodnocovalo _e skóre toho že tam není ten daný mluvčí

a nebudem teď mít úplně to samý akorát že ten dobrej model bude

model klíčový ho slova a ten model pořadí bude _e budeme se snažit aby prostě

na sebe chytal vychytal všechno jiné

tyhle dva modely pro každej časový okamžik jo to je tady důležitý

je pro každej čas

budou _e produkovat

budou produkovat nějaký _e skóre věrohodnosti

budete dělat jejich poměr

pak tady tenhleten prom poměr budete prahovat prahem a když to ten práv přeleze tak

prostě řeknete tady je

míčový slovo tady je taky klíčových

a zase jako když člověk dělá s takovouhle _e

tu aplikaci nebo zjistím keyboard pocením hraje

tak je potřeba

zohlednit jako různý volby takovéto má být rychlý jak to má být přesný tak je

docela důležitý si uvědomit jestli ta data budete prohánět s tím systémem jenom jednou

anebo jestli to bude nějaký archív typu _e typuju superlectures dot com

kde prostě ta řeč bude bydlet _e teďka jako budete mít dejme tomu desítky uživatelů

který to budou prohledávat furt dokola

a tak je docela důležitý si říct jak moc nám vadí nebo jak moc budu

potřebovat slova mimo slovník rozpoznávač

tak zvaných pouhý s

o V sou noční můrou každýho rozpoznávat celé řeči

a jsou to slova který prostě _e při učení neviděl může rozpoznávač takže

když budete

dělat _e

budete dělat třeba rozpoznávač _e tady _e pro přednášky na fitu

tak se tam prostě pokusíte nacpat _e nacpat všechny slova který se tady těch přednáškách

používají

ale pak tady _e otevřeme

kurz na

na co

na

kreativní

okres plování stropu pomocí

fraktálu

a najednou

budete mít _e ve slovníku

_e sádrokarton nás jo protože to budou lidí z se kterýma budete vyjednávat

a slovo sádrokarton _e sme při tvorbě toho systému nikde neviděli přitom proto na ten

předmět bude úplně zásadní prostoru prostě nepude dál

jo _e teďka jako otázka je _e jak moc často budete toho sádrokarton _e nehledáte

k bude jaký bude problém toho z toho _e z toho třeba nemáš

tak za chvilu potom popovídat no teďka _e jak _e jak k tomu kývl spotting

u přistupovat

vona takový tři techniky

jeden se menuje akustický pak prohledávání výstupu rozpoznávače s velkým slovníkem a pak prohledávání vstupu

rozpoznávače s velkým slovníkem které je trošku při ohnuty aby to právě takováhle slova dokázalo

chytat tak poďme teďka

_e nějaké detail k i _e s těmi musím technikám

u té akustiky je to _e řekněme relativně jednoduchý

protože

nějakých modelů fonémů

postavíte prostě

modely těch slov

který chcete

který chcete chytat

to znamená

pro přednášky bych

postavil model sádrokarton _e s

tyhlety model rychlost vám dávají ty dobrý věrohodnosti

pak je tam nějaký model pozadí který dává ty špatný věrohodnosti tady se nám to

celý odečítá a tady prostě toho systému lezou detekce

jo takže vlastně když ten systém chcete používat tak si teprve na základě zadané klíčových

slov postavíte modely těch slovíček který budete chtít použít

je to _e

bezvadný vtom že tady nemáte problém se slovy mimo slovník

jo protože sádrokartonová

super postavíte to prostě jako modelkou jednotlivých fonému můžete to klíčové slovo klidně chytat

ovšem je to za cenu _e za cenu jedné zásadní věci že pokud to slovo

sádrokarton vás použijete

tak ten systém můžete znovu

pustit na všema data má kde chcete vyhledávat

toto jako není problém pokud těch dat máte hodinu ale už to může být problém

vy máte deset tisíc hodin protože když se třeba dostanete na nějakou hodnotu nula celá

nula jedna krát výhod zájem tak deset tisíc hodin

rád nula celá nula na kabrioletem

máte pořád ještě sto hodin no a když byste měli sto serverů kdybyste to rozprskl

i tak je to ještě pořád hodina a takovej google kterým nějakou církvi říkám hodina

takže vám asi moc nelíbil

jo takže tady toto je toto je problém

druhý problém tady toho _e systému je že nemá sílu _e jazykového modelu prostě nikde

tomletom systému není _e není žádná _e žádná znalost toho jak se můžou následovat jednotlivý

slova to znamená pokud tam _e zadáte slovo typu sádrokarton _e s které dostatečně dlouhé

a jako

jasně ho slyšíte tady akusticky rozdílné moc všeho ostatního tak to bude docela fungovat

ale ne po nepokoušejte se takovým systémem _e

chytat slova

jako třeba já _m

nebo po

nebo něco takovýho pokutová prostě jednu slabiku

tak je to

téměř k nepoznání protože buďto někde nechytne a nebo naopak to chytne všude a máte

všude faleš nebo pro

jo takže

ne nepřítomnost jazykového modelu

je docela problém

tak druhý přístup je _e prohledávání výstupu rozpoznávače

velkým slovníkem

_e teďka zapomeňte tady na ten krásný obrázek

ale dá se to _e udělat tak že prostě uděláte rozpoznávání

do textu to znamená někde wavka aby to přepíšete na dnes jsem přišel a potom

když hledáte klíčové slovo přišel tak uděláte prostě vobyčejné graph a na ty matek tam

a

a buďto najdete nebo to nenajdete jo

todleto je možnost jedna možnost další je _e trochu se zamyslet a říci že ten

rozpoznávač taky nemusel být úplně přesnej a že si třeba mohl _e mohl myslet

že tam je

ne sem

přišel

nebo taky došel

nebo taky našel

nebo _e

nebo já nevím ještě si něco vymyslete

a tady tyhlety varianty o kterých si rozpoznávač může myslel že jsou správný dokážete dostat

_e s takové struktuře kterou my vlastně často necháváme rozpoznávač generovat a to je se

říká orientovaný graf nebo s vás

a nebo tomu taky říkám velatice rozes anglického lety

takže když jako se budete byly vnímali má pořád nám budou hodit nějaký mlati matice

hasičů roky

tak při čili case of each S a ale ti se sou tady tyhlety orientované

grafy na výstupu rozpoznávač jo takže pokud rozpoznávač necháte vypudit takovouhle strukturu

_e

tak _e C pokud na té nejlepší cestě je třeba dnes jsem přišel

a ten rozpoznávače tam se k nul protože _e ten člověk ve skutečnosti říká dnes

sem našel

a vy potom použito detektor klíčových slov kde budete _e hledat slovo našel

tak ho tam najdete protože prostě bylo někde jako druhá nebo třetí varianta ale stihla

tisísce uměli zavřeny mimochodem _e ten systém _m se pročesat com nebo přednášky do com

tedy ste možná viděli tak právě používá indexování tady těchhle těch _e těch druhých a

třetí se dalších variant

takže _e občas

když si tam dáte klíčové slovo to budete hledat

tak prostě sto místě kdo systém našeho nenajdete tom nejlepším přepisu jo ale přitom tam

slyšíte evidentně se tam ten rozpoznávač na té nejlepší cestě se knol ale bylo to

někde schované mlaty si na indexoval i sme to takže _e tohle slovíčko dohledat

tak _e

jak si myslíte že se tady ty matice dají reprezentovat

no zase konečný stavový automat

takže no protože

tam máte všude pravděpodobnosti které můžete používat nemusíte ale je docela dobrý je používat

ale ten konečný stavový automat prostě je docela fajn cesta na to je tady to

tuhle _e tohleto lety volati si reprezentovat

a pak se s tím dají dělat krásný operace jo jako že se třeba uděláte

jiný konečný stavový automat který bude obsahovat _m nějakou sadu prohledávaných slov

uděláte kompozici a přímo je najdete prostě jako tady se s tím dělat krásné věci

tak _e taky nějaký nevýhody samozřejmě té rozpoznávače limitována slovníkem který máte zadrátovaný to znamená

budeme mít problém slovy mimo slovní

a za druhé ten servis je sáry složitější a náročnější a pomalejší než jenom akustika

jo takže to že sou tam takový komponent jako výslovnostní slovník

a jazykový model samozřejmě bude znamenat že to bude že to bude přesnější ale že

se vám to bude titíž _e vyvíjet zvlášť pro jazyky kde nebudete mít _e dispozici

patřičný zdroj

tak a teďka _e nemáš naše děťátko

kterým se tady chlubím E

_e rozpoznávač _e visí S R který má ale eště nějakou půlslovní C

znamená to že je vlastně dáno dohromady rozpoznávací C která má sobě standardní slova

ale je tam ještě taková podsíť která když na rozpoznávač prostě úplně vedle a neví

_e který si standardní slov by to mohlo být tak mu umožňuje odskočit

do _e do nějaké po slovní sítě a to je poslední síti to dokáže přepsat

buď pomocí fonémů nebo pomocí nějakých takový několik jako kdyby slabik

jo to znamená že byste měli _e v tomhle případě

_e

když by ta věta byla _e strof mi zmršil sádrokarton a

výstup rozpoznávače ostrov

my

zmršil

a teďka to pouhý slovo by byl přepsaný ně něčím možná jako s R

rok

R

on a jo schválně to ne přepisuju pomocí _e solidních českých slabik protože ten systém

si to může na myslet tak jak _e tak jak jsou to hodí a tak

jak byl takže byla trénován

takže tendleten systém je dobrý vtom že když potom

takováhle obuví slova prohledávat se

tak máte šanci řekni _m dostanete

a mimochodem je to _e i na _e si dobrý na jednu další krásnou je

teplý byste viděli na kterou

je tady tomu systému říkáme hybris jo

_e teda tady jako

slovní síť a tady po slovní na to dobrýho si myslíte že ještě takový hybrid

je

tak

dobrej na to že

dokáže najít obuví slova

prostě

zkuste přinese další

představte si že máte

_e že máte standardní rozpoznávat

tady je věta strop mi zmršil sádrokarton a

a vy máte standardní rozpoznávač kterej tady tuhletu feature u _e ten _e tu po

slovní síť nemá co si myslíte že bude na jeho výstupu když tam vleze věta

strop mi zmršil sádrokarton

něco

co ten rozpoznávač si myslí že dobře

a co má ve slovníku jo to znamená pravděpodobně by tam bylo něco jakost osmi

zmršil

sám

tu káru

dáš nebo něco takovýho podobně

podobně inteligentního

jo tetě a vy samozřejmě nevíte že tady toto je špatně prostě to na výstupu

rozpoznávače on si myslí že to takhle je se jako jednu mann best

rozpoznávací cesta

toho _e toho tečka potom jako hrůzou zjistíte že tady toto byla chyba ale nemáte

vlastně to jak odhadnout přede

takže výhodou toho hybridního přistupuje

_e že vod mám vlastně dá nějaký vodítko k tomu že když se to přepne

do té do té po slovní sítě tak se děje něco divný ho jo budce

na vstupu objevilo auto vocabulary slovo

nebo je tam třeba soubor který bylo invoked byly ale ten člověk se v něm

zadrhnul

a neřeklo pořádně

nebo ho řekl nějakým pekelným dialektem na kterým ten náš rozpoznávač nebylo trénovaný takže kombinace

tady těch dvou sítí vám prostě jako dokáže

říct že něco bylo špatně

jako ramena takový jako ně poznat ně co bylo špatně měli celej vzorky evropské projekt

no vás vybírat

jestli vás třeba z něčeho

měli _e naši dva němečtí doktorandi výborní štefan com blinkal a mirko a nemám

tak ti právě jako

dělali a dělají pořád na těchdle technika

nejenom jak poznatku umí slova

ale jak co s nima potom dál jo

neznám jako pokud bate jednou hybridní rozpoznávač tak se tam otevírá velká rada možností co

dělat když na takovýdle slovo přijdete

jo můžete třeba zkusit ho přepsat zpátky do slov

když máme grapheme to phoneme

tak my můžeme natrénovat tady systém který pracuje naopak které je forintu trefím

to znamená _e takovouhle

sadu

jednotek potom narvete do převodníku a dokážete toho vysoce a zase zpátky slovo

nebo to dělal mirko úžasný ho

snažím se udělat _e takový konečný stavový automat

který by tohleto slovo srovnal se slovy který existují ve slovníku

jo to znamená

_e v tomhle případě by byl schopnej poznat

že tady nějaký sádrokarton který třeba měl ve slovníku

a že tady přípona a která je tam jenom protože se mění nějak morfologie

slova nebo _e jako čím se taky bavil

tak _e bylo shlukování nebo klastrování tady těhletěch slovíček měl třeba nějakou _e jak u

přednášku houbách

různé proháněli standardním slovníkem

a tam bylo prostě jakým mají síly jem

my celýho _m ani nevím pořád jak se to tak se to řekne a _e

vysloví anglicky

a to je tuším jako odborný výraz

pro houbu lesy té někdo

ste houba spektrum asi budete rozumět V

a vy _e kdy prostě máte rozpoznávač který normálně rozpoznává angličtinu nezná tady tohleto slovíčko

to znamená každou chvilku to vyprodukuje něco jako

malej

i

vy

_e nebo něco takového a to se přednášce budete mít čtyrycet krát

jo a teďka jako je docela zajímavý úkolu říci

sekera jako

tady jsem severa dedikoval slova mimo slovník

není náhodou něco z nich jako důležitýho není to nějaký termín který se ste přednášce

mnohokrát opakuje

a právě tady ty klastr ovací algoritmy vám řeknou nebo tak jako tady bylo mají

síly je má pak se to ještě rozpoznalo jednou možná s nějakou fonetickou chřipkou a

pak ještě jednou a ještě jednou poďme tady tyhle slova dat do jednoho klastru

a prezentovat ji uživateli protože to bude asi něco důležitýho

mimochodem

sme na tohle měli nějaký

týden íčko

_e já doufám že ještě

a

no nic kdybyste chtěli tak _e máme _e máme někde demo který ta který tady

toto docela pěkný kozo

tak

no takže bysme byly Ú _e detekce klíčových slov

a pak tady mám nějakou věc organizacích a projekty toto nevím jestli je nevím jestli

je moc _e zajímavý tady tohle může nám může být zajímavý slajd pro vás

protože

jako někdy asi budete do práce neděláte dali bambus tady toto fakultu

tak jenom sme jako se tady snažili zase to byla taková komerčních Í prezentace

lístek o co je vlastně co kdo dělá

a když _e budete ve výzkumu že budete tady

když budete tady na fakultě třeba s námi

tak výstupem je vlastně součástí do jsou technické zprávy

musí se tady dělat C jako s reálnými dacia z running kódem ale ten kód

bych vám vobčas ani nepsal vidět jo protože jsou to jako nějaké bločky matlabu tu

s C plus

_e které se napsali buď dvě nebo vaši kolegové nebo někdo úplně jinde to potřebuje

teda rychle dohromady to znamená napíšete nějaké lepidlo vyšší nebo folku nebo perlu nebo třeba

zrovna přijde pod ruku

dostanete úžasné výsledky

je to nejpřesnější na světě ale zpracování hodiny řeči trvá den

a rozumí tomu rozumíte tomu jenom vy

jo to znamená jako že by toto někam předali nemůže to by to někdo dokázal

zopakovat

to je totální luze

no takže pak je další ste

a to je vývoj technologií že teda jako by to mělo dělat pokud možno to

samé

ale mělo by to být stabilní to znamená mělo by to chytat chyby

kód by měl být nějak verifikován o

mělo by se to testovat na úrovni a komponentu tak potom jako celých systému

kdybyste mít nějaký cíl životní cykly plánování

jo by to me

užívat _e ne uživatelská ale programátorská rozhraní

a taky třese prostě světe by se k tomu přes mladost nějaká dokument a

no a

pak se u produktu

kdy _e vám někdo _e zavolá prostě z nějakého call centra řekne že by tam

silně to detekovat

a zbytek se teda měli zamyslet co máte k dispozici jaké technologie jaké jsou požadavky

zákazníka jak se teda na šroubová dohromady

můžete taky si promyslet komerční model to znamená to co budete chtít peníze jestli budete

dělat nějaké se vzorové řešení do kterého vám budou posílat data většinou lidi nechtějí protože

data nechtějí dat vůbec ruky

no budete prodávali sence jak budete licence vo tak je to docela

to docela zajímavý a samozřejmě u toho potom bude _e sedět člověk kterým bude srdečně

jedno že ve městě nějaký skrytý markovův model ale on tam potřebuje do velké červená

zelené tlačítko na které bude klikat jo takže musíte _e

se

musíte se zaměřit i na to kdo to bude používat a jak to udělat tak

aby

tam sto

místo uživatel dostal to sou čekal

tak

jo tak _e takové závěrečné _e závěrečná věc

tohleto je když tady třeba děláme na nějakých výzkumných projektech tak jsem se snažil udělat

takové veselé schéma jak jsou tady ty projekty organizovány ve státech

my jako sme přepiš ním je tím že se vych asi dvou účastní moje

začíná to vždycky vlastně od uživatele který má problém

když jako _m je

třeba tou agenturou darpa kde hnedka první slovíčko je D sem tak sem si představíte

kdo ten uživatel je že jo nový se to tady vymalováno zeleně

tak _e potom prostě máte agenturu výzkumnou která podporuje takovéhle

projekty jak právo toho du uživatele dostane _e dostane nějaký požadavek

a ta _e agentura vypíše

zadání projektu americe tomu říkají proud oděn si _e jenom sme B A normálně jsou

volně dostupný dokáže to je najít na internetu

no a teďka prostě se dá dohromady _e několik česky tomu říká řešitel

hezky když někdo jako řekne že řeší nějaký grant tak města vyvrací blůzou na hlavě

protože

že to řešíte tak to znamená ta na konci vyřešíte jo jako

mám pocit že

rozpoznávání řeči

že by to byl takový řešitelná úloha ze strany akorát možná by se mohli jmenovat

posouvač i posouvače jedna

posouvat dvě a posouvače N které který se snaží prostě ty technologie lavinu někam posunout

ale nevyřeší

no a _e tím můžou být jednak samotní nebo dají dohromady nějaká konzorcia

a na každý takový projekty je _e je potřeba někdo kdo nasbírá data

a na těch datech se pak bude

něco zkoušet

a potom _e je musí být někdo kdo bude říkali si je to dobře nebo

jestli se špatně

takže ve státech mají mi to že vlastně zavedena evaluační instituce

občas lety bývá někdo jiný když se jedná se o nějaká citlivější data

no a tetě _e

co je docela důležitý

tak jsou tak zvaný kompetitivní evaluace to znamená řešitele

tady dohromady nějaký systémy

lysý nebo někdo jinej dá data a teďka když systémy na těch datech musí pustit

samozřejmě se dosáhne nějakých výsledku

a uši jenom to že ty lidi navzájem mezi sebou soutěží je docela velký _e

velký motor

který prostě každý motivuje abysme bity výsledky byly co nejlepší

no a občas na základě těch public kompetitivní k evaluaci taky někomu někoho vyškrtnou prostě

že by ho postřelili ale řeknu mu tak jako pane nebo paní na příští rok

prostě s váma nepočítáme jako s podporou a prostě mu zastaví peníze o to

no a tady tyhlety

etapy dvou dnů pořád dokola

takže jako by se ta technologie

na konci takovýhle projektu nebo

nebo _e problém uživatel mohl posunout a pokud možno uzeného problém vyřešit

a samozřejmě já se tady tyhle těchdle koleček projede pár

tak ten _e tak to nejlepší konzorcium nebo ten nejlepší řešitel prostě řekne jak se

to má dělat správně

a pak nastoupí zase se bavíme vo státech nějaký prověřeny integrátor

který dokáže jako pracovat tady s těmi _e s těmi zadanými plány a který vlastním

tu technology naprogramuje integruje a

die no neprůstřelného kufříku

tak

té dva všechno úvodu

takže teďka ne přestávka ale _e jenom mini oddech a pak si dáme

průjezd _e

ruje zpracování signálu

takže jsem

jo tady metoda

tak pojď poďme do toho bude to vlastně takový jako víc u C číslicového zpracování

signálu

to znamená to co ste viděli ve druháku pět esku _e nekomprimovanou formu

to je takový politický slice tady tohle jako pro číslicové zpracování signálu vám asi když

vás nebudu přesvědčovat tomu naplatil tak někde před dvaceti lety

jak to obvykle vypadá taky pro jeden rychle prostě analogový signál

_e

číslicový který prošel A D převodníkem potom se s ním číslicově něco děje a pak

ještě někdy se taky převede zpátky do analogu

a tady toto _e

toto bude probíhat jako jo

případě kódování řeči

a ne

případně třeba rozpoznávání jo protože když budeme dělat rozpoznávání tak vlastně přímo cucám jako digitální

informaci a najdete tady jako dali dneska tom T nezpracování a zase docela zajímavý že

když se třeba dělá syntéza

tam nebudete mít na začátku tady tenhleten blok tam vlastně blok zpracování a potom s

toho musíte dostat _e nějakou že

tak teďka _e začněme teda jako stroji nebo s popisem těch našich signálku

na začátku

nebylo slovo

ale _e byl tam signál se spojitým časem

definovaný sudého vod mínus nekonečna do nekonečna

nekonečné množství hodnot

a když budeme chtít takový signál reprezentovat s frekvenční oblasti

tak

fourierova transformace

prostě integrujeme od mínus nekonečna do nekonečna

ten signál čase krát E na mínus dvě pí F T do to

všimněte si prosím vás že tady Z herečku _e už zase přestává mít drát kruhové

frekvence kterými jsem vám vás oblažovala ve druháku

takže

dost často tady uvidíme

je F což bude v obyčejných K _e frekvence R C

a neska někde vedle vono mi napsaný dvě pí

abych to udělal kruhovou

ale pozor

za chvilku když se budeme bavit T číslicovými signály a to teďka bude hodně rychle

tak to F

ne schválně všem

že budou diskrétní signály

u spojitých

je to F v hertzích

čím bude F diskrétní

frekvence

povědět _e nebo v ničem

jo protože v těch diskrétních signálech budeme mít takzvanou normovanou frekvenci

teda vlastně vůbec nebude záviset na tom jako jak ten signál vypadal frekvenční původně

ale bude to jenom nějaké poměrné číslo které prostě půjde vod nuly pro nulu do

jedničky a ta jednička odpovídá vzorkovací frekvenci

a jako vo nějaký hercích se začneme bavit až teprv někdo řekne jaká ta vzorkovací

frekvence vůbec byla nebo má být jo

tak

teďka _e co takové fourierovy transformace vyleze

funkce X F říkáme jí spektrální funkce

je komplexní

je definována pro všechny frekvence zase vod mínus nekonečna do nekonečna má nějakej modulu nějakej

argument

a ty jako funkci frekvence dokážeme _e dokážeme vyplotnout

pokud máme na _e reálný signál tak vlastně stačí znát pominu tady toho spektra pro

kladný frekvence protože tam nějaká _e nějaká symetrie

a my vlastně víme že modul

pro záchranu frekvenci je ten samej pro koplo _e co pro snadnou frekvenci

argument

pro zápornou frekvenci

že bude schválně tohle si z nich zapamatuje

máme frekvence proti sobě

mám reálnej vobyčejný ski signál

tak jak je vztah mezi argumentová na mínus

něčem

a plus něčem

tak ty argumenty jsou tam zápor opačný jo takže tady jedno velký mínus

a kdybyste tady tohle chtěli napsat s dohromady

tak byste udělali

když má něco stejnou absolutní hodnotu opačný argument

dvě komplexní čísla

tak jsou komplexně sdružená a že sto takovou pěknou hvězdičkou takže bysme mohli napsat že

X mínus _e

se rovná X

jedničkou F

komplexní sdružení znamená že _e modul nechám na pokoji

argument nám opačně

tak

takže todleto bla

v rychlosti mezku blesku fourierova transformace no vida

to je tady to dokonce máme tech _e co to je fourierově transformaci dodat

inteligentní signály

mají

frekvenčně omezené spektrum to znamená mají tu fourierovu transformaci koncentrovaná koncentrovanou vodce nějaké mínus mezní

frekvence do plus mezní frekvence X N

do

do frekvence jo

_e klasicky když tady tohle bude třeba telefonní signál

tak ta F mám bude nějakých running tři tisíce šest set

_e herců

když budete _e nic chcete kvalitu tak to bude vokolo dvaceti kilo hertzů

a tak dále té první věc

pokud _e

ty signály nebudou mít omezené spektrum

tak ho buď omezím natvrdo nějakým filtrem

a nebo řeknu _hm

a nechám to tak

a _e pak se mi to může trošku vymstít

když budeme vzorkovat protože dojde k čemu

aliasingu jo tomu k překrytí jednotlivých _e spekter tam se to dostane

tak a eště taková _e vtipná poznámka o fourierově transformaci ta spektrální funkce semene nedá

přesně spočítat jo protože máme tady vlastně nekonečna jednak čase jinak ve frekvenci

máme tady prostě nekonečný moc časových bodu takže můžete to zkusit pro nějaký signál typu

obdélníkový impuls

když mučení C se S ale pro cokoliv reálného prostě to vobyčejná fourierova transformace ne

nejde

tak _e tetě jak je to s tím vzorkováním _e

možná jí kvantováním když myslím že kvantování tady nemám

_e když budeme vzorkovat

tak vlastně na stuff přichází ten

analogový ten černý signál

ten vzorkovač musí mít k dispozici

nějaký periodický signál který má _e mezi jednotlivými má impulz zama

vzorkovací periodu

_e ten výsledný navzorkovaný signál je _e vlastně tady

tenhle červený krát ten původní černý

a když si uvědomíte co se děje tak vlastně ten černý určuje výšky těch jednotlivých

nových tím políčku a toto je náš

navzorkovaný signál

tak a teďka by se dalo vlastně vypočítat

nebo nějak uchopit _e co se děje se spektrem takového signálu když se navzorkuje

tak zase _e sme se bavili _e s tím že se ten

že se ten signál

řekne že jo ne úplně ideální že to tam impulzy které jsou nekonečně krátký a

nekonečně vysoké toto vlastně diracových pulzy

a potom _e když se tady tohle provede tak ten navzorkovaný signál je sled

takových vlastně na váhovaných

diracových impulsů

když si člověk udělá trošku _e trošku nějaké počítání

tak _e zjistí že _e spektrum toho výsledného navzorkovaného signálu

je vlastně spektrum toho původního

je to i X

ale které je nekonečně krát rozkopírovat ne na té frekvenční ose jo takže kdybyste _e

kdybyste tady tenhleten

člen mazali

tak je to prostě pořád to původní

to původní spektrum

ale když doteďka worm až N

a vezmeme v úvahu všechna ta _e všechna možná směnka

tak tady prostě mám

další kopii a tady mám další kopii a tady mám další kopii přístupy

a tak dále a tak dál

no a teď tě _e když budeme

vzorkovat

tak samozřejmě záleží na tom jak bliká bude ta vzorkovací frekvence

a jestli se přitom vzorkování tady ty jednotlivé kopie pře kryjou a nebo se ne

překryvu

si uvědomíme jak to tady s tím bude chodit tak toto je maximální frekvence signálu

F mám

tady tohleto je polovina vzorkovací frekvence

F S

lomeno dvěma

takže dělám celkem jasně že když ta polovina vzorkovací frekvence bude prostě naftou maximální frekvencí

tak to bude v pohodě protože ty jednotlivý kopie se překrývat nebudou

a když _e se netrefíme

tak se prostě ty jednotlivý

opět takhle

pěkně při kryjou

ale

prosím uvědomte si že _e

to není tak že by jako byl takový pěkný obrázek doby ty jednotlivé kopie byly

vidět aby tam ty malované červenou tužkou

ony se prostě jako pře kryjou a sečtou samozřejmě jo takže

že výsledkem je

něco

něco takového

L ještě horšího

jo stromy tato se to z hlavy si neumim moc dobře sčítat

prostě najednou dostanete spektrum

který se _e trochu podobá tomu původnímu ale není přesně ekvivalentní a nedokážete z něho

to původní spektrum získat a

no tohleto nám říká ten slavný šenonův kotelnikovův nyquistův nebo vzorkovací teorém vyberte se podle

preferované národnosti a nebo můžete zůstat politicky korektní

a tohle je ilustrace co se teda bude dít když _e nebude aliasingu

kde ty jednotlivý kopie dokážu krásně oddělit

to znamená pak když si rekonstruovat

a vy kousnou takhle jednu kopii _e toho signálu

pomoci

jaké dolní propusti tak prostě dostanu úplně krásně a přesně to původní spektrum

no a takhle to dopadne když _e

když bude aliasingu

když se vám ty jednotlivé kopie ve spektru

_e překryjí a sečtou

a pak vidíte že tím

rekonstrukční filtrem dostanete nějakou machu která

L a není podobná

_m původnímu spektru

takže teďka máte jako _e za úkol vymyslet co s tím protože tady s tím

výsledkem jako asi nebudete spokojeni

možnost číslo jedna je zvýšit vzorkovací frekvenci že jo

nedávat i nedávat i sem ale posunout i třeba sem

to byste museli případě telefonu třeba jako přemluvit

motoru a noky a siemens _e a

asi tak jako několik miliard lidí na téhle planetě aby zavodili své mobil jakub lysý

nejsou satanisti podaří

a když se vám to nepodaří tak musíte přijít nějakým technologicky špinavější _m ale fungujícím

řešením

a to se menuje antialiasingový filtr že jo

takže tato formule takže máte tady původní spektrum

spektrum před prací té

takže

z něj uřeže té všechny komponenty

které sou výše

dneš plus nezdřímneš plus polovina vzorkovací frekvence avní ženeš

dneš mínus polovina vzorkovací frekvence

když tady to před prase ne spektrum potom _e

_e se vám periodizuje

tak to už zjistíte že se ty jednotlivé jeho kopie nepřekrývají ale že jsou těsně

vedle sebe

a pokud potom uděláte takového _e před prase ne _e o a zperiodizované ho spektra

rekonstrukci to znamená rychle si vyberete

jeden jeho kousek

rekonstrukční dolní propusti jo zbytek zabijete

tak _e dostanete zase zpátky to původní před prase ne spektrum to znamená

je zcela jasný že ste přišli o vyšší frekvence

protože se uřezali

ale aspoň něco co bylo těch nižší

tak je původní

a _e není to zkreslen o

jako v případě minulém by se nám vlastně do toho překlopil i ty vyšší frekvenční

složky a začali se vám tady _e souviselo není

jo mimochodem dybyste todle někdo chtěl zkusit

tak _e si vemte

třeba do matlabu nebudu céčka

_e

nějaký hodně vysoký zvuk třeba senátorovi činely já bitu

co ste si udělat _e podvzorkování

nedělejte žádný antialiasingový filtrování jenom prostě vyberte každý druhý vzorek

a pak se to přehrejte zjistíte že jako

tím zvukem činelů se

tady poměrně zajímavé věci no to vlastně překlopil

_e do nižší frekvencí a na místo činu se vám tam budou vývod nějaké změní

tak

tohle sou je teda poznámky o vzorkování a teďka poďme _e zápisu

vzorkovaného signálu

takže když to vzorkování jenom uděláme

tak vlastně _e dostáváme

_e dostáváme velikosti toho původního signálu nějakých časových bodech

vy časové body jsou určeny jako násobek _e vzorkovací periody

a vidíme že tady v tomhletom zápisu vtom X S N T se nám tam

jako pořád ještě nějak objevuje čas

pořád asi bude tam vzorkovací perioda

se na ni můžeme

klidem vykašlat

a říci že ten vzorkovali je že ten diskrétní signál že to vlastně bude jenom

vobyčejná posloupnost čísel

jo tady toto je strašně důležité protože kdyby tam pořád ta informace _e o čase

musela zůstat

tak bych to měl něco jako

vektor

časovou informací a my to nechceme jsem prostě jenom sekvence čísel

a _e tu dostaneme poměrně jednoduše takže prostě řeknem já si vezmu jenom tady tyhlety

velikosti a všechno ostatní zapomínám a dostávám se potom k _e takzvanému diskrétnímu času

koše hrozně

_e jako hrozně vědecký pojem

ale zase je to není nic jinýho než obyčejný počítadlo

diskrétní časy prostě počítadlo

vzorku podle toho jakým píšete programovacím jazyku nemůže začínat na nule nebo na jedničce

ale

prostě není to nic jinýho usneš než ukazatel já vám se vám jako schválně

nám to někde otevřený matlat

_e do něho načtený kus _e u zvuku

pěkný

_e mám tuším nějaký

jednoduše nějaký dvoukanálový zvuk

tak sis toho vyberu jenom jeden kanál

X bude

no

všechny rozmetadle

jeden sloupec

a to s jako

X je řada čísel

a když si takovýhle X potom zahrajete

kdybych já věděl na jaké vzorkovací frekvenci

si na C déčko

tak ten dvou dostanete v N jo a všimněte si že já jsem vlastně přitom

přidávání

musel dodat informaci vo tom opravdický _m čase na kterým jsou načasovaný jednotlivý vzorky a

to sem tam dodal takže sem té funkci hrající museli co bylo vzorkovací frekvenci protože

tady ta řada čísel prostě to iksko

to je jako

to je prostě vektor to

si dělá srandu

a tak takhle

takže to je _e prostě vektor sto šedesáti osmi tisíc šesti set osumdesáti tří hodnot

tečka

tak _e

fajn když metráků normovaný ho času

tak _e se nám to taky projeví takže potom a nebudeme mít _e

_e když přestal existovat čas

tak samozřejmě přestává existovat výsledek i frekvence v hertzích

a ta frekvence vektoru u diskrétních signálů budeme pracovat bude tak zvaná normovaná

a zase tu normovanou frekvenci

dostanu tak že tu opravdickou frekvencí podělím tou _e podělím vzorkovací

jo takže čas bude mít jednotku nic

obyčejný počítadlo a frekvence bude mít taky jednotku nic

protože to prostě nějaké číslo které teprve cache

sdělím vzorkovací frekvenci začne mít _e smysl R

a dejte si prosím vás pozor na to že když budeme

se dívat do nějaké literatury

takovou času to člověk pozná jo čas vobyčejný ski se značí pomocí tečka a ten

diskrétní pomocí zenka

ale u frekvence to poznat není tam prostě jako se používá F a je to

pořád stejný takže _e poznáte to tak že když tam bude pak třeba zapsaná nějaká

frekvenční transformace

tak pokud _e

tam uvidíte třeba _e na

_e na mínus J dvě pí

S T

tak tady to S asi bude to vobyčejný scheme hercích protože vedle stojí čas sekunda

ale když vidíme třeba _e na mínus je

_e

dvě pí S N

tak si buďte jisti

že tadyta frekvence bude zřejmě normovaná

protože vedle není prostě žádnej _e žádnej čas v sekundách letem počítadlo vzorků

_e

říkal jsem vám

cože ráda funkce komplexní exponenciála

unk se komplexní exponenciále velmi mlsná

že _e pouze vůli radiánech jo stejně jako kosinus nemusí news

to jsou funkce který musíte nakrmit úhlem

a úplně stejně tak _e potřebujete nakrmit komplexní exponenciálu úhle

jo takže jenom _e jako takových quick czech

když máte _e takovouhle

takovouhle funkci

tak _e časy je sekunda

frekvence je jedna lomeno sekunda

to dvě pí je v radiánech

to tam vlastně zavání ten úhel

a sekundy se nám navzájem vyruší a vy tu funkci naplň nakrmíte radián a málo

nespokojená

tady vlastně _e si dejte pozor

protože

pokud _e

rozměr toho N je nic

taky rozměr toho S musí být taky nic

aby vám to zase vycházeli radiány protože jinak to ta funkce E na mínus je

nebude hrát

tak _e toho byl zápis tak tady mám nějaký příkládek

napište funkci pro generování kosinusovky na dvou stech hercích

pro vzorkovací kmitočet _e osum tisíc

můžete si udělat nějaký jako

drobný odvození ale zjistíte že _e že vlastně

normovaná frekvence

bude

dvě sta

lomeno

osum tisíc a pokud prostě pak budete dělat C diskrétní kosinusovku

taky vyrobíte tak

že uděláte kosinus dvě pí krát právě ta

normovaná frekvence záznam schválně nebude dělat žádnou speciální značku

abyste si _e testu trochu procvičili

tak tam bude číslo vzorku

a _e

tím tímto bude

no to bude dáno jo poďme si zase

matlab ukázat něco takovýho budete chtít _e budete chtít vyrobit

_e

F bude

_e se bude

čtyrycet lomeno osum tisíc normovaná frekvence schválně kolik to je nula celá nula pět

pak budeme mít se budeme chtít nějaký rozsah vzorku

tak dejme tomu že půjdu vod nuly a teďka když budu chtít vygenerovat vteřinu takové

kosinusovky tak kolik amanda

jako a ty frekvence osum ti

vteřinu

tak polovinami může říct že osum tisíc druhá polovina že sedum tisíc devades devět set

devadesát devět

je to jedno

já to zkusím D tímhle

a pak si ten signálek pohodě vygenerujete jako dva krát T

krát

F krát no

baum

můžeme si ho dokonce ukázat že jo

bude hrozně krásný

až ten obrázek najdu

no to je vono tak vidno dostali tak tam asi bude kosinusovka

a co víc může si ho zahrát

jo takže když zahrneme to

a

co se udělá špatně

_e no _e který infra

zvuk život navozuje deprese

tak pokud bysme teda se začneme k vyvolání proběhly _m

prostor nenene _e teďka vážně pročte neslyšeli _e kosinusovku na frekvenci

osum tisíc

protože ta funkce samce se má nějaký defaults na vzorkovací frekvenci o kterým vůbec nevím

jaký takže já sem tam nedal vzorkovací frekvenci neřekl jsem nějaké vzorky jsou časovaný takže

vona použila nějaký defaults a _e ten vůbec nevím kde takže pod mi zkusit říct

co to teda mělo být

_e

tak

se špatně

no

já už vím co jsem udělal já sem vám opravdu nebo čtyrycet hertzů a ne

čtyřista herců že

tak se omlouvám ten infrazvuk jako

je skutečně byl

test tak jo

_e

čtyry sta hertzů

kdybyste chtěli čtyry sta čtyrycet _e tady má funkční sluch

áčko nosných _e že

_e vona

se mně doma ozývá přes _e tak _e fajn takže vidíme na jednoduchým příkládku že

není potřeba se bát _e normovaných frekvencí jedna se dá přepočítat na druhou jo pokud

bychom chtěli samozřejmě tenleten normované frekvence

vypočítat tu v opravdickou tak prostě o od normu ju

vynásobím to vzorkovací frekvencí a máma _e mám za tu správnou hodnotu

tak

_e poďme teďka se podívat na to když máme diskrétní signál

jak ho frekvenčně _e analyzovat

jaksi spočítat jeho spektrum

tak _e bude to pomocí diskrétní fourierovy transformace

no i D F téčka

a my si musíme uvědomit jednu věc _e

zaprvé

signál musí být

navzorkovaný nebo diskrétní soustruž teda je

za druhé nebudeme rozhodně schopni počítat prostě nějakou teoretickou haluzi od mínus nekonečna do plus

nekonečna nepůjde budeme muset vždycky ten signál vyslechnout nějakým oknem který bude mít N vzorků

to nám bude mít nějakou rozumnou hodnotu třeba dvě stě padesát šest nebo tisíc zase

čtyři

a s toho budeme počítat _e frekvenční transformaci

takže to bude vstup

text _e to proženeme tady tímhletím krásným

_e

tímhle tím krásným vzorečkem

a na výstupu dostanu zase N hodnot

a teď musím strávit chvilku času N na s tím co my vlastně výstup té

diskrétní fourierovy transformace dál

listu mi dáva

N hodnot

rozmezí vod nuly

a když

do skoro jedničky

ve normovaných frekvencích

podnebí přesnější ještě

tady prostě je spousta hodnot

tady hodnota nula jedna dvě a tak dál a tak dále a cache

hodnota N mínus jedna

a to je konec

jo kdybych chtěl diskrétní fourierovu transformaci

na normované frekvenci jedna

tak potřebuju _e tak už zase musím vzít hodnotu

nutilo vzorku protože to may nějaká periodicita

to znamená počítá se nám to všecko _e všecko dokola

poďme _e poďme si říct _e

jak by to bylo třeba to že naši kosinusovku jo vezmem kus kosinusovky

a zkusíme zní udělat _e fourierovu transformaci

a to si potom si potom zkusíme zobrazit

jo takže mám tady kousíček

kosinusovky

že nekousej kosinusovky má

no

ten kousek kosinusovky bude mít _e

osum tisíc vzorku a řeknu sem tisíce moc co si vybrat dvě stě padesát šest

a z toho budu počítat _e fourierovu transformaci tak si udělám nějaký třeba přes X

který bude X vo T jedničky do byste padesátky šestky

velikost že dobra

pro ženu _e fourierovu transformaci

což je v matlabu

hodnota fronta schválně nebo nakonec zaostření

abyste se podívali se nám to hází _e za hodnoty to vlastně dvě stě padesát

šest hodnot

a ty hodnoty jsou _e ty hodnoty jsou komplexní

jo takže první věc která vás může napadnout je něco takovýho máte spočítány je plot

výkřik

to bude hrozně pěkný vypadá to takhle

jo to prostě japonské tyčky najezení rýže

ale jako asi _e asi

si ne to co jsme chtěli

takže druhy

pokus bude

jistě no tak jsou to komplexní čísla vy bych to mohl zkusit nastat nějakou možná

nějakou jako

osu X rozumnou

tak tu osu X zkusím udělat od nuly do dvě stě padesáti pěti když to

budeme si presaři vzorku

a

najednou dostanu něco takového

už vypadá možná trochu V

a vidíte že vlastně mi to vypsal volný

že se zobrazují pouze reálné části _e toho nás počítaného spektra

_e bych to teda

možná chtěl trochu jinak já bych chtěl ty obrázky nejlépe dva

jeden nebudou moduly

a druhý kde budou

argumenty

jo tak poďme si udělat takové matlabové cvičení

kde _e prvním obrázku

vyplo tneme

moduly díky

bude absolutní hodnota

asi nepude že jo

no tak dvěstě padesát pět

a

to je ve druhém obrázku

bude

jsou argumenty

no tak

pět

_e

no

není byl

_e

jo takže push dostávám něco

N kolmá zřejmě nějaký význam

vidíme že na frekvenční ose

dostávám dvě špičky jedna by asi odpovídáte frekvenci čtyry sta herců že jo

druhá a bude vzor to vodící frekvence mínus čtyry sta hertzů

to znamená někde _e někde na konci

a co se týče to _e toho úhlu nebo

_e té fáze

tak _e

a to se radši ani na to sražením nedívejte

tak teď tě co se mi na těch obrázcích

ne pozdává co je tam špatně

proč _e

se na takovédle obrázky nebudu chtít koukat

měli by se měl osa X

osady se ve vzorcích

a nejsou tam žádný pořádný frekvence prostě jako nedokážu interpretovat co znamenají tady tyhlety

_e to znamenající čísílka na iksové ose

takže my máme dvě možnosti

buď si udělat osu _e normovaných frekvencí

anebo si udělat osu opravdický frekvencí

pokud známe vzorkovací frekvenci jo tak poďme si ukázat voboje voba dva případy

_e když _e osa normovaných frekvencí

tak _e

asi musím vyrobit něco seš co bude nula a skoro jednička a budete mít dvěstě

padesát šest bodů

jo takže poďme zkusit _e něco jako nula až dvěstě padesát pět

radši takhle

děleno mysli padesáti šesti

hold

a pak když to

když to před plotnu

s osou

těch normovaných frekvencí

evuš se mi to bude trošku víc líbit protože tam budou prostě hodnoty bod nula

do jedničky jo takže normované frekvence

na iksové ose

jo že ty normované frekvence jako ještě pořád

nedokážu jako licky

pochopit

tak _e je poďme od normovat milník udělat opravdický frekvence

kromě poradce jak mám udělat osum opravdický frekvencí když vím že vzorkovací frekvence osum tisíc

R

já se bit že jo není tam žádná

žádná vydal to znamená tady

eště přidám násobení osmi tisíci jim osmi tisíci

a o

a už sem tam kde sem chtěl být a dokonce když si to tady jako

někde na sumujeme

tak možná přijdeme na to že ten vrcholek je opravdu okolo _e okolo čtyry sta

_e čtyryceti hertz

mimochodem kde je

kde opravdu

jak je frekvenční rozlišení takové diskrétní

fourierovy transformace

po kolika

hercích tom budu mít jednotlivý díleček

vzorečky

to vůbec není těžký spočítat

protože

prostě mám osu od nuly do vzorkovací frekvence

a na té ose mám N vzorků

jo to znamená to rozlišení prostě vobyčejný ski dělení

osum tisíc děleno dvě stě padesáti šesti znamenal ještě ožer frekvenční rozlišení

to jarek téhle fourierovy transformace třicet jedna herců cokoli bude blíž nejš třicet jedna herců

tak nebudu schopny _e nebudu schopnej rozlišit

jo

tak _e

dyž se vrátím tady k tomu obrázku

tak _e

co je tam se tam takovýho divný ho jako co vás možná

co se co se nám může nelíbit

sme udělali čistou kosinusovku jo

kosinus nějaká _m nějaká frekvence

a jaký spektrum by měla mít takovádle kosinusovka

jeden impulz jedna čára a jinak všude nula

to že tam ta druhá čára to berem jo protože to je vlastně _e dám

z ohledně to že

kosinusovka

když u vzali zem fourierovou transformací tak musí mít nějakou kladnou ale I zápornou frekvenci

takže dobrý ale to že ta čára taková rozplynula

to se nám nelíbí

kdo ví pro činnosti nula

co se stalo

tak _e možná že

by teďka kilo se podívat

co sme to vlastně analyzovali na signál jo

poďme se kouknout co sme vlastně poslali do fourierovy transformace

_e

tady sme tam todle

kosinusovka si

no tady zotavení

tak richmond vidět

já sem vám chtěl říct

jak je ta jak je ta kosinusovka u řezána

ale ze že teda vopravdu no nepovedlo

protože jsem se trefím téměř opravdu oříznutí

přesně na jedné

změna jedné periodě

sme to co sme to ještě trochu jinak

já si udělám signál a _e který bude

_e který bude

dejme tomu čtyři sta třicet pět herců

přemýšlím S to vyjde

no

pískově vygenerujeme znova

tisíc si vyberu

tak no a teďka je úplně jasně vidět že _e nám prostě ste kosinusovce něco

chybí

že

při frekvenční analýze bude

bude řízla

a _e pojmy s frekvenční analýzu teda udělat to znamená X bude s F téčko

tady tohle umíme

_e mám pocit že sem si vtipně přepsal

_e frekvenci

_e

všimněte si hodnoty obrázek

tak

no ze

aha

obrázek je tady ho mám pocit že se může sme dostali trošku _e trošku širší

dneš

když minulý _e zkuste měří ste myslíte že by _e to šlo udělat tak abych

se do té

abych dostal úplně přesný výsledek to znamená vyčíslí čáry

tak kdybych do toho analyzed o analyzační okna vecpal úplně přesnej počet period té kosinusovky

to by se mohlo po vezdil zkusme

zkusme si udělat protipříklad

_e kdy bude

kdy bude

ta frekvence

čtyři sta

čtyři sta lano osum set by mělo dat _e nějaký pěkný číslo

a

o

ho

tak to je docela zajímavý výsledek

jo já musím co sem udělala jsem si zase přepsal tu frekvenci to

možná že

von _e jako frekvence normovaná se podkapitolu a

zbabělci si definuji

proměnné které mají rozumné názvy

tak _e

dávám teda protože jsem se netrefil vůbec takto račice se mu zkoušet

_e

tak teda tak je možné že jsem se netrefil vůbec

vzali jsem neměl na frekvenci čtyry sta herců ale spíš něco

to _e

ne prosím vás _e

před představám tady do tohodle rýpat protože my musel vyrobit něco co nám na osmi

tisících vzorcích udělá celistvý počet

_e

_e co bude mít takovou periodu aby její celočíselný násobek se dokázal

celým číslem na to do dvě stě padesáti šesti o to třeba co

takže nám se

počítač na tady nepříjemný kilo hertz

poslední pokus prosím vás jo

F bude jeden kilo R

říkali domluvit

jo

jo takže dostáváme teďka jako přesný _e přesný čáry

no

tam kde sem očekával _e a nuly jinde

tak _e

tetě mě zkuste říct když metra měli _e ten _e ten případ

že sme měli tu kosinusovku odřízl O někde při nedokončené periodě co se teda vlastně

stalo při počítání spektra

čemu tam došlo

tak tady mám trochu napovím _e když vlastně mám nějaký signál který má nějaký spektrum

a pak toho signálu vyberu kurz pravoúhlým oknem

tak vlastně dělám násobení dvou signálů jo toho původního

a toho okna

jo za vám to tady zkusím možná sem tady někde mám i

_e i napsané ale tady to namaluju

si mám nějaký signál

tetě pro výpočet de este

o potřebuju omezit na nějakou délku

a to omezení provádím takže vlastně vezmu okno který má tady nuly tady má jedničky

tady mám zase nuly

a tím oknem kus toho signálu vyber

jo

a tady tohleto potom vlastně pouštím do

_e diskrétní fourierovy transformace

tech _e když v čase

budu

násobit nějaké dva signály

co se stane vím aspekt jejich spektra má

jo tady je násobení toho červenýho signálu

S modrým vybírat si mokne

mě by zajímalo

co se stane zich spektry protože i to pravoúhlý okno má nějaký spektrum jo

tak zase napovím když nějaký signály vynásobím

tak jejich spektra se

spolu jo je tam prostě ta _e ta nepěkná _e je pěkná

operace konvoluce tak a teďka rvát ještě budu výpad snímků dál jaký je spektrum takovýho

hle pravoúhlý okna

_e nekonečný jo ale vypadal tyto se tam úplně přesně

obdelníkový

impulz

dostatečně jsem se vás tady s tímto impulzem natrápil C F S ku

draku sme

kardinální sínus že jo tak takovýhle nějaký _e spektrum takže my bychom vlastně měli vidět

_e z _e oblasti spektra

konvoluci

opravdický ho spektra kosinusovky to čtou prostě takovýhle dvě čáry

a

_e nějakýho spektra který vypadá takhle

a to je ten obdelníkový impuls

pamatujete si jak vypadá konvoluce

když jeden z těch signálu je takový pěkný čárový

jsou tam jenom dvě čáry

že jeden ze signálu čárový

nebo jeden z těch vstupů tak ta konvoluce hrozně příjemná protože funguje jako kopírka

jo to znamená tam kde sou ty čáry tak vokopíruju ten druhej signál takže moje

spektrum

by mělo vypadat

já takhle prostě okopírovány na jednu stranu a okopírovány

na druhou stranu

tak a teďka je taková jako lipova otázka

jak to že tady tohleto spektrum nevidíme

vtom

_e spektru

toho našeho vzorkovaným signál protože tam prostě jako nejsou vidět ty

postranní _m lalůčky

kde sou slovany

tak zase odpovědět _e že mi ho nevidíme

protože vlastně _e tyhle ty body

se nám trefu jo u

přesně do násobků

té základní toho základního frekvenčního rozlišení který nám _e poskytuje naše D F téčko dokonce

si můžete udělat jako drobný odvození je to asi nebudou řádcích

ale tady vlastně ty body na frekvenční ose

mají vzdálenosti

_e nebo ty jsou daný jakou k a

jedna lomeno N krát

vzorkovací frekvence

a

_e prostě minima toho

kardinálního synu nám padají přesně tady v těchdle bodu

to že to tak _e tak jestli vám dovolím

demonstrovat na jednom příkladu

kdy vlastně jak uměle zvýším _e frekvenční rozlišení toho _e toho D tečka a najednou

tam na nás začnou ty _e začnou ty _e funkce sinus kardiální skákat tak mě

projektech mám zvýšit frekvenční rozlišení D tečka

potřebuju přidat při kotli počet bodů na frekvenční ose

dělat velkou flintou trase které se říká doplňování nul nebo zero P ding znamená vezmu

pořád ten samý signál to mám k dispozici

ale prodlouží vo nula má na nějakou délku

a s toho potom _e spočítáme fourierovu transformaci tak poďme na to

dáme X zrovna _e

nebude to žádná čuměla na ale _e

ale X _e ten prodlouží nulám a

a budeme počítat třeba s tisíci dvaceti čtyřma vzorkama

takže tam bude jedna a tisíc dvacet čtyři mínus dvě stě padesát šest

op

jo vidíte že na začátku _e vektoru mi to nacpalo moje čísla potom na potom

samý nuly

_e

X bude jeho fourierova

transformace

budu muset předělat C normovanou frekvenci protože už nebude mít ta frekvenční osa dvě stě

padesát šest bodu ale budeš mít tisíc dvacet čtyři

takže třeba von ona

bude nula až tisíc dvacet tři _e lomeno

jestli zase čtyři krát osum tisíc

a

jsem měl by se to dalo vyplotit takže tady bude von a na

_e

princip si

S N

jaksi _m X

jej

tak se špatně

v los

_e

tak _e tady to je sem vám něco po vrtat

jak protože má

že má velikost

musím říct že jo

prosím

ježišmarja děkuju jasně _e

takže

opravujeme takhle že jo

jo děkuju

dobrý

ho

a

S oplození mohl no fungovat

no vida takže najednou na začínají vyskakovat ty postranním lalůčky

_e karmy nární _e toho kardinálního stínu

který předtím nebyly vidět jo protože _e když se měl to základní frekvenční rozlišení tak

jsem měl vzorky jenom tady A

a tak dále

a tak dál jo

takže _e _m končíme ale jenom prosím vás i v uvědomte vlastně co tou diskrétní

fourierovou transformací vlastně počítáme

vypočítáme spektrum vzorkovaného signálu takže dostaneme frekvenci něco periodického

signál neříkal oknem

to znamená že ve spektru dostáváme

vlastně jeho konvoluci

se spektrem obdelníkový o impulzu

a teďka ještě pozor to spektrum který jsme spočítali N je diskrétní má prostě konečný

počet hodnot

to znamená že když byste to dotáhli do jako uplně do extrému tak vlastně jsme

spočítali spektrum

čase periodický o signálu kde ta perioda prostě byl mnohokrát za sebou a tohle jenom

taková opakovací tabulka uvědomte si prosím vás

to sou ty komplementární operace včas a ve spektru viset čase vzorkuje tak si ve

frekvenci periodizuje

když se čase periodizuje tak se ve frekvenci vzorkuje akorát domu neříká vzorkování ale diskretizace

jo

tak

toto prosím pro dnešek že

_e prakticky už sme to udělali tak prostě budem asi trošku filtrovat

jinak prosím vás laboratoře má se zápisem na labiny všechno v pohodě nedostal jsem žádné

žádné útočné maily tento která se předpokládá že se vám registrace zadařilo

several

ano tento týden laboratoře jsou

eště se si pořádně sem ui

tím L

a tento týden je

podle kalendáře takže mám pocit že lichý ne

a strašně podívejte se nebo má