Přepis řeči - Konvoluční neuronové sítě

a dobrý den hlas tajný tam u nás na fakultě

já jsem teda tady domácí je to místnosti sem život ještě nepřednášel který je pro

mě to ne

a nevíš bylo řečeno a bude ta je mluvit o konvoluční neuronových sítích těch s

těmi se věnujou poslední tak dva roky a předtím jsem dělal ze další věci nedá

disertaci mám na detekci objektů v obraze pomocí metod které jsou a deset let staré

patnáct

konvoluční sítě sou uplně a nové téma které všechny velké firmy začínaj používat je teda

paka nemyslím prostředi hraje poslední dobou začínáme hrát trochu druhé housle protože nemáme ty miliardy

peněz a obrázků které oni mají

nicméně ten a abysme už šedá ta

tady máme na tom původním slajdu jenom takovou a motivační nebo demo to nebo do

motivační obrázky

celou dobu vám tady bude říkat jak jsou

konvoluční sítě úžasné jak umí všechno možné

ale i když se podíváte

tejdle těch článku ke kterým tady mám obrázky

tak chtěj pokazil že

pro koho konvoluční sítě je velmi jednoduché třebas takového školního autobusu na kterém jsi konvoluční

se o kterém si konečně si myslí že to je stoprocentně školní autobus

malými změnami které čili vůbec nepostřehne sto udělat obrázek o kterým naráz ta sítě přesvědčena

že to třeba tygr

že takže

ty tom

ty metody kterých já budu mluvit uměl úžasné věci ale a fí gui

na to že slovo to konvoluční sítě jinak než člověk čovek a takhle mezera člověka

takhle nezblbnete čověk a zas na druhou stranu můžete zblbnul úplně jinými způsoby já to

na ty moc můžeme

tak a proč

proč vlastně

sou konvoluční sítě důležité

proč je důležité slovo ke učení a tak

když se podíváte na tom co se děje průmyslu

náš průmysl těmi slintají ty a posledních dvou letech tak najdete spousty článku které mají

titulky a koupil převzal firmou zabývající se stát tam zabývající se hluboký mučením

a akademických které kteří od osmdesátých let pracovali z neuronovými sítěmi naráz prací po pro

vůl pro face book pro yahoo pro bajtů

podstatě všechny velké internetové firmy a hlavně ta vyhledávače ale jiné firmy při dnešní době

vytváří týmy které nedělej nic jiného než že trénují neuronové sítě

no doopravdy zakladatele a

tak a pak s akademické obce na neuronových sítí teď pracuji pro tyto firmy

o čem bude tramvaje přednáška

ne s letos tomhle pořadí ale plus minus kteří vám ukážu jako je jako náznak

toho co konvoluční sítě umí

pokusil se vás přesvědčit proče používat

proč vlastně funguje tak jak fungují

já teda nevím jak moc se a máte představu o tom asi takovouhle neuronové sítě

sou co to sou komerční sítě to už možná nevíte vůbec

a tak pak bude část přednášky kde

velmi jednoduše se pokusil vysvětlit základy stará toho co to sou neuronové sítě nebude tam

žádná složitá matika ale tam složitá matika ve skutečnosti vůbec není

ty neuronových sítích

spíš nebudem taky jako co to je jak to pochopit co to umí jak se

to učí

pak se to samozřejmě

a projdu to co s tak ve městě vy můžete dělat střední můžete čekat

na chce můžete mi použít

že můžou fungovat ad se používají

a pak nakonec ale pro vás to může bydlet určitě zajímavá část se podíváme té

existují nástroje pro totiž pro učení neuronových sítí existuje spousta open source free software nástrojů

a které prostě můžete stáhnout z internetu

a přeložit a sáhnout si dokonce ne o existenci neuronové sítě a přímo je třeba

používat velmi jednoduše si třeba udělat webovou stránku která bude rozpoznávat a jaký druh psát

je na obrázku

to té práce tak najednou odpoledne

tak zatim nástrojem konkrétně o kterém budu mluvit je kafe což asi dnešní době takový

největší projekt

a pro

používání neuronových sítí a zároveň je asi vás nejjednodušeji použitelný

tak

a čím takže ne všechno začalo

a to bylo

a využitím konvoluční sítí pro rozpoznávání toho cena fotce

když se podíváme

a samozřejmě když víte co je na fotce

tak pomocí tomu že tady hledal

a já co tady mám otevřený tele a to je normální stránka googlu a fotky

toto je moje kolekce fotografií celá může dělat tuhle chvíli tak já můžu zadat třeba

řekne na co bych se podíval

abych se třeba podíval

jestli je mám by to cenu někde slíbil

takže

zkoušíme

zebra a

dobrý zabývala

aha takže vidět že já mám minimálně dvě fotky zabere se kolekci

to je na tomu kdo přišel

tak není takže by

já u těch fotek zadal na té fotce zeptat

ale oni mají natrénovaný neuronový sítě

které vezmou ten obrázek podívej se co na něm je řeknou je na něm se

prát

pak na někde databázové u těch u těch fotek vlastně mají

a tady ty automatické anotace

id zadám zebra tak se už akorát prohledala a ta textová databáze normálně jako když

se dělá textový vyhledávání

a současnosti

a tyto metody fungují velmi dobře

já když to vyzkoušet dál

kromě

tak samozřejmě když a mě co na objekty rozpoznávat deva celkem jednoduše tady vidíte že

vám vyfocenej nějakej nějaké autobusy

když se podívám co třeba by mohlo být složitější back třeba nějaká činnost

nech

napsal jsem to dobře

to je to ti no samo že se si to vyzkoušeli by to mělo fungovat

tak

lidech tady jde že jsem fotil někde na ně

někde kde se běhalo

vyzkoušel místa

dobře a tak tohle je moje kancelář pan kdy jsem pracoval

dokonce

můžeme zkusit něco co vůbec vlastně na obrázku neměl být poznat

třeba jako sranda von

a dokonce mi to nejde obrázky které vypadají že tam ti lidi doopravdy a se

mají dobře veselo

to tohle si můžete vyzkoušet pokud máte no

určitě

máme nazdar

mělo by nevím proč ne

to je to věděl

částečně ano

samozřejmě tohle nefunguje stoprocentně jsou věci

něco podobnýho to je vyzkoušeli

třeba store

jako něco

jak se tam vidíte

samozřejmě najdete

a teď metody nejsou stoprocentní ale filtry na devadesát procent já těch lidech tam mám

hodně takže ono to může vybírat

ty který a to neukáže třeba všechny not na velkou přesnost ale nejde to a

všechno

ale

ale většinou to funguje

ad to

tebe jsem fotil já ti badminton

mám fotky badminton

a tohle dopravy

dostání by tam šli musel něco textově zadat cokoli

je zajímavé že jsem zkoušel google nevyhledává podle lidi nevím proč

ale určitě je to měl taky

sral tohleto bleskem

zjistit se na fotce

a vy kdybyste chtěli chtěl něco takovýho

prezentovat člověku tak pravidelně byste

chtěli napsat popis to je fakt

to je poslední době velmi nové téma

a je to vlastně spojení porozumění textu s porozuměním obrazu

a dokonce existuje a teďka letos to byla první soutěž velká kde vyloženě cílem bylo

ty máte fotku vytvořte automatický systém aby vám fotku popsal

a to co ukazuje tady tak to je hra výstup

článku kterej na odkaz máte tam dole pak se není klidně můžete podívat

a se dá to sou skutečné výstupy ste já s nějaké neuronové sítě

jak vidíte tak

a doopravdy ta neuronová síť dokáže poznat že tam sedí člověk hraje na kytaru

a skáče tam nějaké dítě a je tam doopravdy

hráče který spravuje někde silnici

některých případech zase funguje to dobře

to je uprostřed má být kočka

to nevadí a pak se pak jsou případy kdy kterémuž ty fotky jsou nějak zavádějící

nebo

nejsou tak časté je to znamená potom skáče čili za ním je voda tak je

dost pravděpodobné že dá s autem nás auta novej importované na trampolínu před a před

tou vodou a fretku

a s ovladačem asi na internetu našla často nenajdete

pak samozřejmě jsou

případy kde si opravdu řeknete co asi dělá

jako toho

a medvěda

toho koně tam nevidím ten kluk vyloženě má bitovou pálku ale

to je to je

když se podíváte tak

tohlencto je ta úroveň kterou dneska takovýhle systém můžete čekat já někdy to funguje úžasně

někdy to udělá chybu ani věc

si řeknete pane bože co se

ano

tady třeba tady ty systémy jsou to nenatrénovaný asi na při statisících fotka

a na tři sta tisíc i fotka žádném případě není a zachycené všechno co kdy

čech může vyfotit

no na věci které co jako je normální tak na těchto pak funguje většinou dobře

a fotky které jsou divné tak na těch nebo nejsou moc časté na internetové na

ti to moc nefunguje

samozřejmě fit zvuk používá konvoluční sítě třeba na rozpoznávání obličejů

to je takové ty nápovědy kdo je

za tímhle sou konvoluční sítě vezmu vlasy nejlepší rozpoznávač obličejů současnosti na světě

tak nevím jestli jste viděli

o sou letošních prázdninách velký boom na internetu na ready to je spousta vláken a

na takzvané ty trims to není nic jiného než že a vás pro nějaké natrénované

neuronové sítě

a vy můžete chtít aby to neuronová síť změna ten obrázek tak aby se víc

líbil tak aby tam byly věci který ona by nich ráda viděla

a pak na to si můžete stáhnout zdravíčko pipe no

který využívá kafe můžete si lze klidně takovéhle obrázky zkusit doma nebo si nahrát obrázek

někam na nějakou webovou službu

a pak vám ukážu ještě vydá občas dostanete strašně psychedelické a

fotky

s těma to jde udělat zajímavější věci

a třeba toto je existuje tečka článek s letošního roku kde můžou si fotografi

a říct neuronové síti s těmito fotografi aby víc vypadala jako nějaký obrázek

takže

tohle je sem se té za styl

bohužel nic moc nevyznám ale můžete si klidně udělat pro své vlastní fotky ve stylu

ne před poznámku bys mu

by mohli nějak impresionizmus nebo něco

a podobně

dokonce

tomto případě můžete

zřejmě na vstupu pustit video

a udělat si a alenku kubice testovali kůži šedivo

a nakupovat

to fungovat

a ty

neuronové sítě které starého za vším co se týče ukázal

jsou stejné

no to je plus minus ta samá neuronová síť používaj se ty samé algoritmy na

vy na vytváření těch neuronových sítí

ale výsledek je uplně jinej podle toho jak je nakonec použijete

takže jedna což je jedna velká výhoda kulečník neuronových sítí

a to takže když se jednou naučíte

dokonale najdete si něco

včera jsem a můžete pracovat nějakej tool

tak pak si můžete to dělá strašně moc věci

té jeden nástroj tady mám umožní dělat téměř cokoliv

tak to bylo takový je

abyste se do toho trochu za kousaly

a teďka pudu

a takové základy a myšlenky já nevím co vy ste kdy slyšeli ostrovem učení

takže a projdu high úplný úplně základní myšlenky strojového učení a jak ty metody fungují

nebude to nadlouho

pak se dostanu na ty neuronový sítě

teď mám úplně hlav

základní takovej

a základní úlohu kterou vlastně konvoluční sítě se dostali i do povědomí a akademické obce

těch firem a a veřejnosti a to je úloha kdy máte obrázek jak chcete zjistit

co na něm je

to se a

to si nenaprogramuje to hned nemůžete vytvořit program kterej by a se podíval na fotku

a podle nějakých vám za daných pravidel řekl že tam je strýček na surf

to asi ne předpokládám že jste mě někdo myšlenku jak na to jít

to prostě není nejde tam musí by něco inteligentního a co se

a co se toho člena jen statistovým naučí rozpoznávat

není to definovaný program ale musí tam být něco se to naučí

tak jenom tak to je tom to je taková vsuvka byste měli představu

a čeho se google snaží dosáhnout

a s možná víte jaká je slovní zásoba

cože nějakých řekněme po vás otče trochu víc tak dejme tomu aspoň pět tisíc slov

a v ideálním případě při rozpoznávání věci na obrazu bys

bysme aspoň chtěli a vědět co na tom obraze ve smyslu a nás podstatných jmen

přídavných jmen a sloves co se tam děje a to je právě to je ta

slovní zásobu

znamená taková nehoda síti na případě by dokázala

a říct deset tisíc různých věcí o obrázku

navíc teda jo když na obrázku auto

tak on může být na různých místech takže ty chyb informacím dadistova nic

a kromě taji těchle obecně kategorie jaké automobil běhání vražda nebo podobně a světa ještě

horší protože listy

trochu konkrétnější věci typu konkrétní lidi jasný člověk

a vy ste uplně někdo jinej sme podstatě jiné kategorie objektů

a s existují místa chcete když sem a bych beru tak co nejsme na hodině

jak jsou té konkrétní jedeš

na ten tento problém je obrovskej

a my se k němu dostáváme

ale ještě nejsme uplně tam kde by se měl byt

abysme dokázali to sem to co člověk

tak jaksi love učení funguje

že vy máte nějaký program

ktery se dokáže adaptovat

co on

co on ví tak to je že

i když mu dáte nějaký

vstup a pro ni

co ten program má říct

tak on se dokáže změnit stát

aby a doopravdy protestů říkal co má říkat

takže

typicky když budete mít nějakou metodu strojového učení i vytvoříte data set se jsou třeba

tomhle případě americké vlajky a kalašnikovy

řekněte jim kterej obrázek je kterej

těch musí být dostatečně na hlavy

protože

a ten program nikdy nic neviděl žádné obrázky tak tam se musí naučit všechno znovu

dáte mu takové ty data se sichuan třeba hodin o den dva dny

budu počítat

a pak můžete po těch dvou dnech čekat že

a snad

a bude umět rozpoznávat a vlajkou ad kalašnikova

ad to play základ strojového učení a ve skutečnosti

to je to jediné cestou je učení

co vy jako lidé o ušlo tomuhle viděl promluvil

tak když se podíváte tady na ty dva obrázky tak si

porovnáte podoby ten vypadá skoro úplně stejně

co samozřejmě pro počítač

tam žádná podobnost není

počítači lidí ty obrázky

jako maticí pixlu který které mají nějaké numerické hodnoty a

pak a neexistuje žádná lehce rozezná to na podoba mezi těma ano tam a pixlu

vtom novým obrázku a vtom pravý obrázku

a na úrovni toho obrázku ty tady ty default

no a ta malůvka ta fotka vypadají úplně ale úplně jinak

a velká část

počítačového vidění

není o něčem jiným

nešlo tom

jak zajistit aby se dalo poznat že dvě věci vypadají podobně

a my bysme

někdy se měj reprezentaci obrazu

která

prostě pro jednoho člověka

pro tu malůvku vlevo

vytvoří nějaký vektor čísel nebo nějakou jinou reprezentaci která bude velmi podobná tom obrázku vpravo

tak tu chvíli

dokážeme dělat už jenom na podobnosti těchto chtěl reprezentaci bysme dokázali říct že třeba tady

na těch fotkách dvou je ten samý člověk

a je otázka jak to udělat

with brown o tom trochu mluvila utej ukazoval spoustu

spoustu deskriptorů my tomu říkáme

to znamená nějaký popis obrázku a tu globální popisy a ty lokální popisy

a to tohle všechno co někdy někdo

napsal ručně

na téma připravit jako jeden

a s kterej se dost často používá právě rozpoznávání toho cena obrázku

a je to založený na těch

který by se metra vidělo to ukazovátko

ještě viděl

tak si dáme pět deset minut přestávku

ne jednat

počítače vidění se používá reprezentace obrázku

které se říká back off borec

táta je založena na tom ženy když vezmete ten celej obrázek tak zjistit že celej

obrázek se podobáte dobrým obrázku tak to je složitý

kazit malej to zajímavý kousek se na obrázku zjistit že se podobá malému zajímavém opravdu

rakousku zde obrázku tak to už jednodušší

minimálně protože

když se a by se nějaký objekt pohne

tak ty malé kousky se pohnou ale pořád vypadají stejně

emise se dívali na co je ten obrázek ty prostě obraze kde čili je vpravo

nahoře vlevo dole tak vypadá jinak ale ty malé kousky vypadaj pořád stejně jste ty

objekty chybou

a se dá udělat vektor obrázek se dá

a dá se

můžete si říct že se budete reprezentovat ne u nějakých mít druhý výřezu pomůžete mi

druh výřezu typu

a ta tady oko

a jsou solí

a se holt kola

ve skutečnosti pak tady tyhle

je na typy výřezu nejsou pojmenované ty jenom

jsou definované tím že vypadaly je že to je skupina výřezu obrázku který prej právě

podobně

ne výpadek jeden velkej obrázek můžete reprezentovat

jako počet takovýchto různých a druhu malých výřezu můžete mít obrázek

se a ten na té ženské můžete mít tak prezentaci

je tam dvakrát oko je tam jednou nás je tam jednou psal

a nikdy tam není šlapka otko

to může být vaše reprezentaci toho obrázku

lze úkol a bude víc těch šlapek těch začínat

tak já taková reprezentace obrazu

vypadá a podstatě vypadá velmi blízko tomu co vám tady ukazuju

tohle teda fotka

kde sou male výřezy

ad výřez jsou přeházet ne

to co fandí ten počítač

a on prostě lidi jako jsi ty malé výřezy plus minus vypadaly

ale už neví kde vtom obraze sou

dokážete například věřit co na tom obraze

ne kteři někteří lidi s tohle jo někteří ne

tenhle obrázek je teda jednoduchej to doopravdy from což učitele velmi přesná klasifikace to toho

obrázku

ale člověku se mnohem líp koukal na tom obraze

a nejenom že se tomu

a na to koukali člověku ale

ve skutečnosti tady tom obrázku je

a mnohem víc to je důležité informace které která nám umožní a

pros rozeznat interpretovat ten obrázek a tady vtom ale jak tam je tady geometrie egid

to že to ferrari tak rozpoznáte kvůli tomu pomocí toho že ta červený a jsou

tam kousky který vypadá jako kousky auta

takže teraz

a když se zeptám

tohle teda je doopravdy jako vsuvka která se jako voliči asi těma přímo nesouvisí ano

sou vy si pak a ne o tom no

prosím

tak

ve chvíli když máte tohle obrázek tak určitě

velmi jednoduše

až ve chvíli kdy ho nemáte

by to šlo taky a bylo by to výpočetně náročnější

a jo takhle když obrázek

tak

pixly vedle sebe

mají velkou pravděpodobností stejnou hodnotu

což znamená že byste dostal vedle seznam a rozházených kostiček

tak když se na té hraně zjistíte

a co je na ní na za pixly a najdete si seznam vlastně toho co

by tam mohlo hlasovat pomoci to že si řeknete vedle tom obrázku by měly být

stejné pixly

a pak dáte jako globální optimalizaci kde ty kostičky se budou hýbat tak aby pasovaly

k sobě něj takže začnete spojte ty co nejvíc pasou sobě pak

co posilou trochu míň až dojdete k tomu co po se a nejmíň že sto

je kamoš pak zapadne

máte velkou šanci že to dáte

a to tohle

ta ratejna to na

na tomhle slajdu a jsem chtěl ukázat co dokáže člověk on

a se vtom novým obrázku tam té informace

je úplné minimum tam jenom ta černá bílá a ještě to

tak jako velmi a ne hezky

a vy prahovaný to nejsou tam vidět žádné a kontury vás ve skutečnosti těch hobby

toho objektu který tam je

o já doufám že vy stejně

trochu vidíte na co na tom obrázku je

pozn poznáte někdo cena tom novým obrázku

tak a jakej dokonce

jo je to je to dalmatin tady

tam je tam vyšší sloužit

name a

ucho

levá a pravá a levá přední a zadní na něj

zásad

a nevím jak to vidíte o tom a na to tak vidím krásně

mám to blíž prostě

a jestli čili tohle dokáže rozpoznat to že to dáte dohromady a

jako vy pozor je tam spousta vpodstatě bordelu který vás rozptylové

ale část vypadá jako třeba toho wattově celkem poznat

takže vy nedokážete rozlišit prostě ty kousky

a samy o sobě a pak si to dokážete ještě na celý dohromady

takže check má pak výhodu toho že to dokáže vnímat naráz ten obrázek a všechny

ty souvislosti který tam jsou petra mimo jiné díky tomu že mozek je obrovské a

dokáže to strašně moc počítat

tom pravým obrázku jet informace také minimum ale prostě vidět že to nějakej skejbordy stranou

rampě a zrovna jede domů

a dokonce možná podle té barvy si řeknete co při západu slunce

tak hezkej čili dokáže pracovat

se strašně málo informace

na té informace muslim na hlavě se rozhod

s vesele čas

ale pak si představte že budete dělat

rozpoznávači židli

židle řeknete si to vidim každej vždycky to post poznámce židle

ale jí se pak podíváte židle můžou vypadat

tak

a budete docela překvapení tohle všechno sou židle

a není nemají vizuální společně každá para úplně jinak

podstatě židle

tom za chvíli je nemůže když vám řeknu

definujte mi židli tak ne nakreslíte židli

která by obsahovat všechny možné

víte že to

co nejspíš řeknete tak je to něco na čem se dá sedět

a ne není to podle toho jak to vypadá jak je to máte pasťovi to

vyrobený

ale podle toho že strana nic použít

a pak jsem ondřej neff tuhle chvíli

kata práci nějakého rozpoznávače který se dívá na fotky je složitá

protože to prostě podle toho slajdu nejde poznat

pokud dyž neviděl nějakou prodloužit ne

a ty zas dobrá věc

když se podíváte

to je na ty malůvky

tak vy dokážete říct

je to sou obličeje

no když vám řeknu že to sou klíče tak aspoň budete souhlasit že to sou

pryč a přitom to se lidského čtyři čáry

a dokonce

podle to

podle toho jak a jaký mají tvar tak možná dokážete říct něco víc o tom

třeba ta vpravo nahoře

jak vypadá že trochu naštvanej a ten dole vypadá že to bude číňan

přitom to sou jenom čtyři čáry

takže

je možný že když si takové automaticky systém

najde ceny důležitý vtom obrázku

není jako to sou ty orientaci očí a pusy

tak tu chvíli

i když na a když tam bude jakákoliv informace tak co bude fungovat

když si najde tom důležité co doopravdy definuje reprezentuje ten obrázek

takže

tohle takovej slajd a zaslání

a tradiční přístup počítačové vidění a spoustě ve spoustě dalších oblastí je takový to

máte ta ten obrázek

s toho bych stahujete nějaké

příznaky co jsou

čísla

která by měla být

podobná pro

podobné objekty takže to židle tak bude mít stejná čísla nehledě na to třeba

jaké nevysvětit se to

a pak je nějaký jednodušší klasifikátor

ktery ušli je teda metoda strojové učení a ten pak říká

tady tahle vektor čísel tyto příznaky to vypadá že by to mohla být židle že

by to moh by člověk

a ta

tom jako tradičně

ty příznakové ty extra který příznaku tak voni by tě brna mluvil

ty navrhuje čím navrhoval člověk

to prostě já tomu říkám tady anglickém slajdu jo držen akademik evolution té dopravy

evoluční algoritmus

kde a stovky pěšky studentů se dějou před počítačem a zkoušijou jít různé typy příznaku

a dívají se jak dobře fungují na jejich problémy

já se teda o taky je to strašná otrava

žere to strašně moc času a hlavně vy vytvořit nějaké příznaky

řešíte jak je problém pro ty tvořivé nějaké příznaky a trochu jiný problém

moc nefunguje takže to musíte začíná znova

je to hrozná otrava

no abyste mě představuje

jak toho funguje tak to jsem udělal pro tu bohyni a klasifikátor s těma lok

a s těma back of worlds příznakem

myslím že to představit že a ta fotka ta call fotku může to teda reprezentovat

těma lokálním a část má a já můžu říct třeba že sem tam našel tak

jak plus mínus devět ruku dvě nohy

žádný světlo od auta a úplně omylem na tam sice není ale co už

a našlo našla se tam jedno kolo

a tohle může být doma je reprezentace toho obrázku

pak může být jednoduchý lineární klasifikátor což není nic jiného než že

ale včas

je to vidět

není že ne

já to

jak je to vidět trochu nebo

takže bys věděl jsem to je to dobré

když viděl jsem

ja bude simkartu

já to teďka zkusím to jemnější bude pude jednoduše

takže tématu reprezentaci a ten můj klasifikátor takže toho co je navržené člověkem který detektory

těch částí

a to je ten vektor čísel této co se naučí těm určujícím algoritmem a pak

můj klasifikátorům že říkat že

spoustě dozadu

super i to

tak

jsme zachráněni

takže

ten klasifikátor prostě může mít nějakou váhu pro každou tu část

a může fungovat tak že vezme

a protože tady ta bohyně mívá hodně

i když někde najdou se i mají velkou váhu

a nějak indikují že to bude asi ubohý

takže tejden se srazili nula celá sedum

a dohromady dají nějaký šest celých tři jenom jediné tabu mě také míla ale užší

takže definuje jo

tak tady ta váha je menší

a zas dostanu nějaké číslo

a bohyně nevím a

jak sme ne

kola a světla

tak dej mají negativní váhy a za vlády když na tom obrázku bude hodně kola

světel tam pravděpodobně nebude moc

je tak teď výpočty ste hlava násobí dostanu nějaká čísla ty se sečtou

když to je to výsledné číslo je větší než nula tak mu ji a s

klasifikátor může říct na obrázku je bohyně

když ste menší než nula tak to řekne že to není bohyně

tady tahle klasifikátorům může být třeba pokud jste slyšeli vytvořeny pomoci a support vector machine

s nebo klidně jednoduché neuronové sítě

a je tak to jednoduché

tak to jednoduchá je spousta metod počítače a tím

pak

co to je hluboké učíme se jste to slyšeli

ale

jakej úžasný pojem skloňuje se všude možně

a za chvilu za to někdo dostane hoblovku

ale není to není to nic úžasného

nějak převrat

úžasné to funguje

takže tomu tradičním systému která tam byla částek srdce příznaku kterou navrhli to je ti

studenti

a ten jednoduchý lineární klasifikátor

v hlubokém určení

se tyhle dvě části dají dohromady

vstupem do učící algoritmu na nás nejsou ty příznaky jako tady

ale ty původní data

a všechna

a všechno to zpracování se nechá na tom učícího autority

on se naučí extrahovat příznaky on se naučí to klasifikovat

samozřejmě tuhle chvíli

ten učí celebrit musím si nějakej složitější větší trvá to dýl a potřebuje víc dát

protože to nemá toho člověka který by tam a chodil nějaký příznaky a využíval svojí

znalost o tom se důležitý na tom obrázku

ale musí se to naučit s těch dat

je to složitější ale zas na druhou stranu vy když

hele vám jedno funguje tak to můžete použít na cokoliv

zároveň je

to funguje

takže věta člověk

vím

moc vy moc nevíte co

pro počítače dobré aby je rozpoznávat jestli na obrázku člověk nebo ne

ale ten počet se to nebo ten algoritmus to dokáže naučit sám a

bratra potřebuje víc

to je to jedna definice hlubokého učení

hlubokej čili pak pro tuhle přednášku znamená korun nebo konvoluční neuronové sítě

hluboká a další taková charakteristika těchhle to v hluboké učení tak je že

nevytváří ju nějakou grafickou reprezentaci

a světa

ale oni mají

mají třeba detektory v různých částí objektů

prvním nějaké fázi zpracování se naučil že svět se skládá se nám

vlastně chtěl benátek jiříka říkal že

obrázky to je strašně moc velká část je prostě takováhle bílá nic neříkající zeť pak

je nějaká hrana a této zajímavý

takže

ty metody hluboce učení se naučil

to že tam zase se takle vypadá

a první části se třeba naučil nahnal za ty hrany

pak mají další vrstvu zpracování

ve kterém se naučil že ty hrany se dají poskládat do něčeho složitějšího

no třeba do další rána do a

koleček a podobně

a pak zas tohle

se zase vytvoří složitější reprezentace se s detektory složitější věci tom obraze

to znamená už něco co vy dokonce dokážete pojmenovat to vypadá jako plástev

tady je tak podobně houšť push to sou je pak na té vysoké úrovni někde

ste neuronové síti jsou to věci které dávají smysl

co s to sem prošel jako ten

pracovat

a ten bude

aha úvod konkrétně do neuronových sítí a zkusím to vzít

tak nějak

a to na vysoké úrovni abstrakce

co to je neuronová síť dejme se sem někde viděli možná se

sem někdy učili a někdo vám oni říkal spoustu zajímavých věcí

pro mě

neuronová síť je to c to je na tom obrázku

a je to a je to nějaká funkce

se tak jak uznáte z matice jak si napíšete na papír

která má nějaké neznámé nějaké parametry které se dají měnit a podle těch parametrů ta

funkce dělá různý věci

a pak se zas takovouhle funkci děláte tady vyplní chcete aby pro nějaký vektor čísel

na vstupu

dala nějakej vektor čísel na výstupu vy máte nějaký požadavky máte nějakou trénovací sadu

kterou řeknete co vlastně ta funkce mám dělat

a pro mě vpodstatě s jakkoliv bude mi to je ta funkce vypadat tak pořád

je to neuronová síť

dává to smysl nějaké dotazy

tohle neuronová síť

určitě velká to přečíst

jeden vstup

dva parametry a

a na nějaký místo

a datové asi nejjednodušší neuronová síť strom ukažte myslet samozřejmě

ty reálné neuronové sítě sou dvě krát větší miliónkrát když to pořád je to se

sami je taková jednoduchá funkce kdybyste chtěli můžete si napsat jako rovnici na papír a

krát ten papír bude ouvej

samozřejmě když a definuje to neuronovou síť eště musim

definovat

co s co se má naučit a jak se to má naučit

když i madam

a takovéhle data set

také k

co s nima udělat

jak má změnit svoje parametry aby a doopravdy dělat to co mám

tak proto

proto resistor pak řeší rovnice

to je tady tahle třeba

a to je celá rovnice které která definuje

jak se má neuronová se naučit nic jiného tam není

emisemi podíváme

ega říká že má

matematika není potřeba ten tak aby to vypadalo zajímavě

a říká že

a něco minimalizovat hledat nějaké minimum

může měnit a ne

při hledání tom dva a to sou ty parametry té sítě

pak tady je suma

ta suma je přes

datasets té přes ty malé obrázku

a pak

na každém to na každé té dvojici to prásklo to co mám jít

a se podívala

na si spočítá tu vlastně tu funkci

podívá se jaký je rozdíl

mezi výstupem té neuronové sítě a tím co má být

proč tady je na druhou

takže ten rozdíl zápornej nebo kladnej

to na druhou ženský bude kladné

liga že

a se hledá minimum

pak všechny tady ty rozdíly tahle tady ta optimalizace se snaží co nejvíc menší

jsem to můžete podívat tuhle chvíli

takže třeba tady dělám a

regresi snažím se naučit

a funkci která by mi říká když budu vědět

kolik má člověk a podkožního tuku

a bude skákat svazu metrovej výšky tak jaká je pravděpodobnost že si zlomí nohu

a tady

jak mám nějaké lidi které se teda sněhu metrů shodil

to normálně děláme tady

hlavně se studenta

já můžu

a ty samozřejmě já nevím jak oni spolu souvisí

ale když se řeknu že můj model tady tenhle závislosti

bude to je ta jednoduchá lineární funkce

já můžu leda ty parametry a té

vydávají teda smějete čáry tady

tady ta minimalizace jenom říká to že tady ty

vzdálenosti

těch bodů co sem naměřil

o té mojí přímky musel být co nejmenší

teď se a to je cele

strojové učení a aspoň

select relevantní pro tohle přednášku

no minimalizace nějakých i na nějaké trénovací sadě

nějaké je jednoduché funkce nebo složitější

samozřejmě

samozřejmě to co já jsem říkala se tak hezký

krásně to funguje

a na to

samozřejmě své problém

tohle sem si včera matlabu měl pár pěkných grafiku

že jsem si můžete říct že ty body to sou a ty lidi co sem

shodil

a s těch dvou metrů

a snažím se najít tu závislost mezi vy jako jejich a ty činností a

to pravděpodobnosti zlomení nohy

otázka je

vy vidíte že

tam je nějaká závislost jako to někam vede

a jaká ta závislost je

a ta tom prvním obrázku

qt ta jarní

to sem proložil ty body

se to lina funkcí

ona jako sedí ale jako ne úplně dobře

pak ta závislost může být

a kvadratická to už má dost parametrů tam budou je složitější a lépe sedí těm

datům

alfa už to vypadá to jako dobře já může jít dál můžete model udělat ještě

složitější

tady tohle může

polynom čtvrtého řádu jednak prostě zas ta křivka víc prochází těma horama

tajit můžu ještě tu ten model ze složit edit ze složitě data i když se

podíváte push fakt těsně obíhá kolem těch bodů

ale když se podíváte tady někam

pryč mimo ty byly když vidíte že to někam úplně ulítaná a můžete se začít

dřít takže technice divný a

ten model může ještě se složitě to takže model kterej

doopravdy dat

dokonale prochází těma horama které

která si naměřil

a řekne si že tady ti ležet

tady asi mezi těmahle dvěma podává

kdy ta křivka takhle nahoru lízt já to je taky ne

nemáte pravdu

ale proč by nahoru list neměl

a to je ten důvod podstatě takové že vy předpokládáte že když

a to jsou ty dva body vedle sebe a tady to dáte nějak

pro změnu země pokračuje

takže ten průběh mezi těma bylo mám bude nějaký takový hladký nebude moc složité

a vy předpokládáte že

tohle bot a trhu nebo

má něco společnýho

že by kdy se mezi něma

tak se může se můžete dívat podstatě na tom c praotce vlevo

a ty hodnoty který jste neviděli uprostřed tak ty s těma co sou kolem budou

mi něco společně

to je váš předpoklad

stejný předpoklady je vtip metodách to vyloučení

cz což znamená

že

když máte nějakou

nějak trénovací data

něco na čem určite pro se to říká tomu klasifikátoru co existuje ve světě

tak když

ho na tom na ty na ty naučíte a pak ho dáte něco podobnýho

a to bude dostatečně podobný teda nejspíš bude fungovat

ale když mu dáte

když se modeluje proč strašně složitej typ dat málo a

to znamená ty podobný věci se tam najdou

tak najednou tam začnou fungovat takovýhle věci

což teda můžete se zjednoduší ten model větší problém je

že kdy když vy tady budete mít data tady máte no tady a budete se

pak

to klasifikátoru ptát

co člověk kterej tady

proto je ta pravděpodobnost jaká tom že máte žádný data ten

trénovací se tě nebylo nic podobnýho

tak tu chvíli

dostanete nesmysl

aby ten

prostě ty metody který na mluvím fungují krásně

a ale

přestalo fungovat ve chvíli

dyž a

jim po nich budete chtít něco co ste jim nedali šanci se naučit

ne si nedokážu míšo

takže ve výsledku jedinec se dělají tak

dělejte inteligentně

a jediné co dělaj

takže

pokud jsem viděl něco podobného

pak dám podobnou odpověď

se teda ještě trochu naučí jak ty podobnosti poznat

ale když prostě budete dávat někomu a něčemu jenom tři tak se nerozhodne naučí rozpoznávat

kočky

praha neuronové sítě

neuronových sítí existuje spousta

ty funkce který já sem tady definoval kterých pořád mluvím takový ve skutečnosti mají název

dopředné neuronové sítě lan maji nějak i vstup

ta informace nich

pokračuje dopředu a pak si na konci něco vyleze

ne to takhle

dopředu jedním směrem

existuje jo tak pro pořádek říkám že kdy stejný neuronový sítě

já vím stejně budu mluvit a pro mě jsou neuronové sítě teďka tohle

výhoda

co jsem se to nakous o těle neuronových sítí je máte pak

jeden nástroje můžete s ním řešit spoustu problémů můžete si říkat klidně a vás

jaká je pravděpodobnost že si ten člověk zlomí nohy nohu můžete

poté neuronové síti chtít

řekni mi chce na tomhle obrázku za typ objektu jestli to člověk

a pes a auto nebo něco jinýho

a tato výstup v jedné chvíli jsou kategorie objektů druhejch

a to je to tom prvním příkladu sou to a ty pravděpodobnosti můžou klidně lispem

být pozice

může být výstupem tech

na všechno tohle jsou ale existuje neuronové sítě

a my vevnitř fungují stejně

existuje jsou na ně stejné algoritmy na to učení stejné nástroje

a ta

všechno je stejný akorát

smějte malou věc co že to co říká se mají naučit

ale se to naučí

takže strašně univerzální nástroj

hluboké sítě

většinou mívají těch vrstev víc

se máte nějaké vstupem má několik skrytých vrstev a pak na konci z nich něco

vyjde

pokuď zase ste někde ve škole neuronové sítě měli tak nejspíš byly zakreslený tak jak

jsou tady

se znamená že tady je nějaký neuronů na se podívá na to

co mají jaké hodnoty mají ty verony před ním

je co spočítá dá to tam

to tohle je sice hezké ale když ten neuronové sítě mají pak

a milión a milion euro miliardu neuronů tak by se to těžko takhle bude kreslit

ovšem to takhle

s těma jednou vrstvu druhou prstu třetím dost tu čtvrtou vrstvu

mezitím nějaký spojení

a já to nejradši kreslím špaget no takhle plus jenom ty vrstvy já kreslím jak

jsou na sebe napojení

tohle způsob jak doporučilo neuronových sítí přemýšlet

a to je hlavně ta jo těch dopředu

co to prostě vrstvy které je

něco počítají

já jen ne jak jednoduchý výpočet packou s tou dat

vy máte ten obrázek na vstup pak se něco udělal dostanete třeba že čísel pak

se sem a něco udělá dostanete něco dalšího

no nepřemýšlejte o těch jednotlivých neurony

ale v těch operacích nějakých vrstva

a ve skutečnosti

pak mám slajd

kdepak i když tady tahle reprezentace vpodstatě odpovídá tomu registr to

programovali nějakým programovacím jazyku

tak co s neurony

neurony jsou

a tyhle jednoduché funkce

je to ta jsou nějaké váhy a neděláte neuronů nedělá nic jo ne že vezme

váhu vynásobí se no tak s tou

a přičte další stopy na vynásobeny v aha

a ještě pouze tam nějaká aktivační funkce

která není lineární

jenom

na mění a hodnotu to neuronů svátek má nakreslenou jednu aktivační funkci které se říká

rectify byly miliony

seš zní strašně vznešeně ale není to nic jiného než že se vezme

maximum

a t hodnoty a nuly to znamená když ten neurons počítá něco co je menší

než nula

výsledkem je nula

takže vysočina je sice větší než voláte výsledkem je to co spočítat

tohle jsou neurony které se použili těch hlubokých konvoluční sítí do kterých já tady celou

dobu mluvím

není to nic jiného tohle přesně ten výpočet to neuronů

tady akorát těch vrstvách takovýhle neuronů je teda spousta

a ta síť kdyby se to provalí nějakém programovacím jazyce

vy ste to dělali sami tak doporučuju třeba a python na s nějakou knihovnou jako

nám pane která dokáže nás matice rádi na zimní maticí a vynásobit s vektorem

pak ta rovnice takovéhle neuronové sítě

a nebo ten kotel neuronové sítě by vtom a tom slajdu vypadalo tak je to

tady mám zapsaný

a bylo by to topili byl do dopravy tahle

neuronová síť by

tom programu byla

kteří tři řádky

na jednom řádku by bylo spočítej tu první vrtají tuhle vrstvu cože

matice pán

té vrstvy krát vstupy

a pak udělají maximum s tou nulou

a tady ta operace by se tam opakovalo několikrát

a protože těch vrstev je víc pane vždycky stejná krát prostě má jinou maticí tak

a počítá s těma aktivacím a předtím

a tohle by byl doopravdy

program tady nebo té program kterého jsem si párkrát napsal

a to je to co počítá neuronovou síť

důležité je že tady tyhle věci se musí počítat rychle

se znamená že musíte použít nějakou knihovnu vona ti

něco

třeba kde už někdo zoptimalizovat to matci násobení

a když třeba pro teploučko nebo pro grafickou kartu procento ručkoval tak vidím že teda

matlabu nebo a céčkovou se plus pomocí tmě tak nějak implementace knihovny vás co že

prostě lineární algebra násobení matic

pro grafiku pro grafické karty můžete použít pod podle vás

knihovnu

máte tam sobě má tyhle operace ten program pak vypadá takhle jednoduše

a zároveň je extrémně rychlý

tady a tyhle operace mají výhodu takovou že sou

je na tom hardvéru a dyž na těch grafických kartách nebo nácek loučkách

a který se dneska vyrábí podstatě využití využít veškerých výpočetní výkon a když to budu

počítat do grafické kartě

a tak mě to pojede a efektivně třeba jeden a půl upoutal která fotku

otřeš je skoro to co tak ať to dokáže zvládnout spočítat

a spousta matiky

chcete na chvilu pauzu nebo

jak to vidíte já bych teďka mohl dat

tím otou pauzu

nebo ne

tak kdo chcete pauzu

jeden mi někdo další nenech to samotný no jestli chcete pouze

to tam teďka nebude trenérka strašná vatikán bych před tím se udělat pouze ten

toho

jenom malička

tak jedem dál

já pak budete mydlit čase na oběd na

tak

jak jsem řekl že víte jak vypadá neuronová síť už víte

se definuje to co se má učit že to sou prostě nějaký rovnice

a teďka jak to učit

ano tohle jsem si chtěl udělat krásné grafy které by to ilustroval i jednoduché

bohužel jsem

a optu druhé

se rozhodl že pudu spát

tak a takže tady budou je jenom rovnice budu toho trochu povídat

ten problém to učení je teda minimalizace ňáké funkce

která říká a jakou jak velkou chybu má ta neuronová síť na nějaké trénovací sadě

a když vy chcete najít minimum nějaké funkce

úplně obecné jakékoliv funkce

nejspíš se tam vydali na střední škole

tak pokud zas po mi na té tak

vás učili že můžete vzít derivaci té funkce

nebo krát neboj gradient

a když pudete protisměru já to tenkrát jen vám říká ve kterém serveru ta funkce

roste

aby když pudete opačném směru

tak ta funkce klesá to znamená že když pudete dostatečně dlouho tak dojde ten kdo

minima a natrénovali strašnýho rovnou síť

tomto lese přesně dělá krát a srdce znamená že učení neuronových sítí je

o trošku středoškolské matiky

derivace

a pak nějaká velmi jednoduchá optimalizace

tak když kam jednoduchá optimalizace tak pokud jste slyšeli někdy nějakou tu metodu

tak touž je složitá metoda naučí neuronových sítí používaj se jednodušší

používej se ve skutečnosti ty nejjednodušší možné

a té protože ty neuronový sítě jsou velký a cokoliv složitějšího

nejde počítat

takže

to když je když řeknu že se spočítají derivace když na ty možná když vám

napíšu

se jako by se vás zeptám spočítejte mi derivaci z this na třetí tak vy

řeknete že to a jako když budete derivovat podle to x takže to je kolik

televize skoro udělal blbce teďka

šest x na druhou že

to zvládnete té strašně jednoduchá funkce takže nějaká složitější funkce vás máte střední škole nám

asi učili že a de použít takzvané čin já nevím jak je to v češtině

na střední škole se dal pozor ale něco zapomněla jak se ty věci mnou také

či prostě

můžete když máte

a nějakou funkci která se skládá ze potom

mladej třeba bude a

druhá mocnina stínový nebo něco takového takže nejdřív můžete

je to můžete rozložit

lidi si spočítat

třeba tady tahá to je ta druhá mocnina ten si můžete spočítat derivaci té druhé

mocniny

oproti tomu co je vevnitř

a pak si můžete spočítat derivaci telce vevnitř

oproti

tomu co zas vevnitř toho dědečka

a dopravy tak je to tady napsaný

tak já tak se to tak se to dělá tak to dopravy napíšu to znamená

tak byla dopravy derivace té druhé mocniny tak jak já jsem tady řekl derivaci a

dvou x na třetí a teď by bylo třeba tady dvacet toho synu

akorát bych se to vynásob o

takovádle složit složená funkce je neuronová síť ta dopředná

vy máte vrstvu když se podíváte na výstup který máte ty vrstvy ta

a každá ta husa používat to co spočítalo nastat předtím

to znamená

jsem to můžete podívat takže ta funkce

která je aplikována ta poslední vrstva je funkce které aplikovaná na funkci té vrstvy předtím

to zas na funkci té vrstvy předtím a takhle to jako máte doška poskládaný do

sebe

na doopravdy když použijete tu to rčení modul kterej se naučil na střední škole

pak dostanete gradienty té neuronové sítě

a z cílem se takže říkám gradienty tak je

tak vy chcete gradiente těch parametrů ten neuronové sítě těch horách

tak tady je celý algoritmus tady toho jak to udělat ve skutečnosti

když máte nějakou nervovou síť tak ty grády rámci těch neuronových sítí aplikaci toho čin

root se říká error backpropagation ale je to název pro to samé

spočítání těch derivaci mach vůči nějaké chybové funkci

a prakticky když nepočítáte tak

a to znamená jenom to že vezmete

vstupní data

spočítáte co počítá první vrstva druhá vrstva třetího stačilo ta vrstva má ta vrstva

spočítáte chyby

a teďka ty chyby které na konci nejdou

tak

propaguje té zpátky

a ta propagace zpátky je podstatě stejná jako ten postup dopředu jo jak to je

chtěl jsem vám ukazoval že při tom dopředu průchodu se vezme tu takže vynásobit nějakou

maticí pak se to vynásobit zas nějakou maticí a zas nějakou maticí

jak jsem zpětný průchod je to samý akorát to násobit transponovaným a matice

no výpočetně to samý

abych vyliž máte tady ty dva průchody

tak tyhle tak sis pokud si zapamatujete ty dopředný hodnoty ty aktivace zpětný

aktivace kterým se v tuto chvíli řídit tuto chvíli říká a derivace těch neuronů

jakpak to jistě levou čísel myslím že to spočítat tak gradient těch horách

a to spočítat ten a přesto vynásobím co

takže cele učení neuronových sítí je podstatě jenom sčítání a násobení

tuhle chvíli

tímto nedostanete gramme gradienty a trvám říkají kterým směrem roste chyba

když ty

grady říci který vlak budete moct vach odečítat

tak budete muset chybu snižovat

a kde tak minimum

a tam skončíte

to sem teďka popsal toto je nás zas ty gradienty sem

ten gradienty sem kradete jasný kdy sem té se s tou takže dete dolů nějaké

ty chybové funkci

a to co doopravdy děláte které nějaký které čítejte radši algoritmus který vezme

část datové sady

třeba když budu mít byl obrázků tak si vezmeme sto obrázku s toho

histograms pro ženy sítí

že neska hádky

spočítá si

s tohodle

ty gradienty září

a ty gradienty odečte otto co má

jak ta si vypadá to

a toto jedna iterace a pak to udělá zase a zase a zase to třeba

dělat dva dny a na konci je sto vyleze krásně na trénovaná neuronová síť

a chcete se na něco zeptat víc

předpokládám že místo učení neuronových sítí nechcete slyšet na to stačí dělat kdybyste chtěli vědět

něco dalšího

klidně se můžete přít zeptat na jí to napsat mail

tento problém

ale jako hezky

obrázek zase

proč to nemusí fungovat

a to se sem tady na trest matce nenakreslil já sem stát kde

přiznám se

tak jsem že to představit že máte neuronovou síť která má dva parametry

tohle jeden tohle druhej

tom prostoru těch parametrů ten borec říkala jaká chyba ta neuronová síť bude mít dyž

a nastaví teda ne a paní té sítě tady prostě v tomhle bodě bude mít

takovouhle chybu tomhle bodě budem ta koule chův tomhle bodě budete kouli ta neuronová síť

i když někde začnete tak ten se kastli gradienty se prostě de

takhle

směrem dolů který ne jako co nejrychleji to vede k nejmenší

zamřeme se může stát že vy začnete tadydle kde dotaz tady do tohodle a vy

začnete o kousíček vedle

takže jdete do uplně jinýho minima

tomu se říká se to může zaseknout to učení nějakém lokálním minimu

a vy nikdy to globální nenajdete praxe prakticky to nejde

ale dobrá zpráva

u velkých neuronových sítí

všechny tady ty lokální minima tam můžete dojít jsou vpodstatě stejně dobrý ne úplně jedna

tam najdete

tak

teď začínaj ty zajímavý věci asi tři slajdy na konvoluční sítě jak fungují

když víte co to je neuronová síť

a to těm prostě takže jednoduše

co to sou konvoluční sítě

a jako

konvoluční sítě

proče používat

tak důvod je ten že se hodí na obrázky

nebo se hodí na zvuk

prostě se hodí na něco co má strukturu se i daný signál třeba olej jiným

věcem máte nějakou strukturu

a normální neuronový sítě tak já se malých teďka mobil

tak jak jsem říkal vstupem je vektor nějakých čísel vagóny

nepředpokládají že ten vektor čísel baráku strukturu je ten by ty čísla vtom vektoru můžete

přeházet

a to ta neuronová síť vám bude fungovat úplně stejně co můžeme to musíte přeházet

konzistentně nemůže toto pro každej obrázek třeba přeházet jinak

ale prostě tomu jedno je v jakým pořadí

dáte ty data na s

těch konvolučních síti

a nyní využívají toho že existuje obrázek

a ten obrázek

jste víte že některé pixly jsou vedle sebe některé sou tahala vedle s můžou být

horizontálně vertikálně

a prostě pak to takže to všichni víme a není důvod aby to tam neuronová

síť na to musela přijít sama že pixly jsou vedle sebe

tak

trochu do historie

yum o tom že

tady nemluvím o ničem nějak extrémně novin

tak vězte že

první rozumné konvoluční sítě push jsou z roku devatenácet osumdesát

japonský zkumní fuk ušima

poprvé navrhl něco co vypadalo jako konvoluční síť učila se to jinak než dnešní konvoluční

sítě

ale ušlo fungovalo prostě měl nějakou nervovou síť která dokázala

ten co s tím dělal

a možná že rozpoznávač čísla jsou systémy

rozhodně to fungovalo

ty současný koaliční sítě s

mají mnoho věcí společně

tak když se podíváte do devadesátých let

tak tam už doopravdy najdete

konvoluční sítě které

fungují a učí se téměř identický s tím a s

svátek budu povídat a povídám

a například já molekul ne

ten

těch devadesátých letech propagoval komerční sítě

já jsem tenkrát nevěřil že to může fungovat

ukázalo se že ano

a střebání udělali tak push nějakých devadesát český mu dali strašně dobrý rozpoznávač počet celých

čísel tenkrát udělali asi ještě s částečně wifi týden

a ještě devadesátých letech jako ty komouši si těch trvání vyvinuli pakr rozpoznávali jsem a

části našetřit

a se v americe se používaj šeky

tak já to se tam check načmáral tak ono to jako na to pustit i

komerční sítě

a nestačím se na to někdo díval tak někomu platil podle to nějaký peníze

to když to nepoužít takhle tak to asi fungovala

tak pak dlouho nic a nebo je tam někteří lidi se něco snažili na skončila

síťová použité dělat

ale ve skutečnosti ta situace byla taková

že když někdo napsal článek o krůčcích

sítích

tak ho to nejspíš a nikde nevzali a nás to depresi a

já žádné časopis ta nechtěl

a tak

ale

velká změna roce dva tisíce dvanáct

krize s kým to na pár dalších

porazili všechny možné jiné právě takové ty klasické systém na kterých a založeny na těch

back of world

kterých já jsem vám vysvětlovali fungujou

a jedné velké soutěži

ta soutěž se jmenuje a míč net

a classification čele nič

což víš nedej data set

a tak asi cache na čele nič znamená že každý rok

prostě výzkumníci se snaží vyřešit problém nemají

přes milion obrázků

ty obrázky můžou patří do jedné s tisíce tříd které odpovídají objektům které na tom

obrázku jsou

a cílem je prostě udělat co nejlepší rozpoznávač

co je na obrázku

tady na to na tom této datové sem

vtom roce dva tisíce dvanáct projekty z esky a další

dosáhli asi dvakrát lepších výsledků než cokoliv co na to na téhle poloze se

a podařilo před tím

ad to bylo takový velkých kromě toho se naráz

chytlo spousta lidí

zjistili že ty konečně sítě prakticky do na něco použít

a fungují velmi dobře v některých situacích

začali používat na všechno možný

a zejtra mezi tím

proto roku dva tisíce třináct

konvoluční sítě se začaly používat na všechno možné

a velké firmy začaly nabírat lidi trest pár vteřin rozumí konvoluční s tím vytvořili si

týmy a vůbec být má jen ta face book má a svoje oddělení kteří fakt

nedělají cílem je že tedy komerční síť

proč

proč vlastně ty konvoluční sítě začaly fungovat

tak jeden s těch důvodů je že

když to zjednoduším

a s jakou s tím to že ty sítě vypadají trochu jinak než vypadaly dřív

tak velky velká část

proč se používají teď víc

je že máme rychlejš počítače

ano

to je teď

jako

ne s

vy si můžete sice

na svým domácím počítači a zadem natrénovat síť

takže se dá říct že toto výpočty měl výkon není potřeba šla dvacet tohle před

deseti lety byste měli a jednu místnost superpočítače tak se za mohli spočítat taky

to nebyl problém

akorát s ono to většinou funguje tak že toto spočítáte pětkrát až teprv po šesté

to funguje

tak když musíte ten superpočítač prostě využívat a

nepřetržitě půl roku ani každýho tam nepustíte vás tam a někdo vykopne

a když to můžete udělat na jednom počítači doma na grafické kartě kterou koupíte za

deset tisíc

tak naráz i s tím že teherán ono to eventuálně začne fungovat

ad to tohle jeden důvod proč jako to úspěchu

se teď se tram počítat

můžete si tou počítá se můžete dělat spousta experimentu

jako jednotlivec nepotřebujete k tomu milióny dolarů

proto to funguje

a máme teda velký datasety a podobně

takže konvoluční neuronové sítě

to všechno co sem říkal neteď platí pro ně

a pár takových rozdílů docela dost často bývají hluboké to hluboké znamená že mají klidně

vrstev

holek jak já jsem tam měl jako neuronovou síť tram na tři vrstvy tak není

vyjímkou že ty a končí si těch počítačem vidění mají dvacet třicet vrstev za sebou

jak jsem říkal tak ale

a předpokládaj nějakou strukturu těch datech

že to obraz je obrázek

má je sou hodnoty na ty negry du

a pak ty

ty výpočetní vrstvy

trestu lezli jsou konvolučním tak voni

tu strukturu toho obrázku reprezentují

a co znamená že třeba já když nemám kus to áčka

tak tady ten neuron ste další vrstvě

on se dívá jen tak na to lokální kus to ať on se nebude snažit

spojovat

tenhle pixl tady s tímhle jsou moc daleko od sebe to vubec nemá smysl se

na ně dívat jak spolu souvisí se

na to bych potřeboval moc dát nemá to smysl

a zároveň celé celý dělají

tak je že

to je ten

neuronů jenomže sedí válka

ale ten samej neurony je

zpracovávat celej ten obrázek jo ten samej norem je zkopírovat nejsem a dívá se tady

na tenhle kousek na tohle kousek na tamhle kousek

a takže to tam je

několik druhů neuronů to je konvoluční síti

kde každej ten uran se dívá určitým způsobem zpracovává kousek obrázku

zpracovala a zpracovat tak zpracovat zpracuje tak celej ten obraz

a to tomu se říká ty tomu druhu zpracování se říká konvoluce

těch koaličních sítí

místo maticová

jsou konvoluční nad

a pokud jste někdy vám někdo ve škole říkal ste konvoluce

tohle sou ty samý konvoluce

tak co umí konvoluce

viděl bráška řekl ale

neuškodí stvořit znovu

možná jste viděli něco takového tady mám vizualizaci nějakých funkčních jader

je to konvoluční jádra

a když se podíváte teda ne to něco bílýho černýho vedle sebe

se což znamená že umí detekovat hrany

a detekovat hrany určitého směru

takže pak pustíte

a na nějaké třeba obrázek kočky

nějakej ten filtr s ty vole dokáže back detekovat procent

smysly

a na tom obrázku to není úplně jde vidět

ale svatej takhle detektor by detekovat

horizontální hraný ty meta třesu tady

nějaký vertikální hrany jsou tady

představte si to tam

a to tohle se normálně počítačem vidění dělala

a většinou tady tyhle filtry na někdo navrhl ručně

prostě konvolučních sítích takovéhle filtry se trénují na datech automaticky

a zároveň

zároveň je a

to takhle vypadají třeba té první prostě a pak jsou na další vrstvy a pak

sou filtry které sou aplikovali

a takovýhle obrázky

o víš neviděl ten obrázek je už neviděl

myslet nějaké filtrace

to je třeba jsou krásně jakých filtru

tady jenom tak abys

líbilo jasně co ta

konvoluční rozsahu nějaké neuronové síti počítá

ekonoma teda nějaký jádro který nenatrénovaný a to sou prostě hodnoty nula celá jedna nula

celá dva

a mínus nula celá tři

a testování pochválí tak neuronové sítě

co se dělá tak se vezme pixl toho jádra tak se vynásobí

s pixlama obrázku

takhle se to udělá pro celé jakéhokoli pro celé to jádro

a všechny ty

takhle vynásobeny hodnoty se sečtou a dej se do jednoho pixlu na výstupu

ta konvoluce

to je tam operace

se pak dělá

nejenom na jednom místě ale dá se na celý obrázku

ta sama

ad těch neuronů končí neuronových doslech pak takovýhle konvoluci je

a to tady mám jako ukázku actor

jak může vypadat ilustrace takové komerční sítě

to je na vstupu máte obrázek který má nějaký rozměr a tři kanály on je

barevné jo máte mám modrou zónou červenou

řešit co je znamená že i ty jádra

nejsou kupé tak jak jsem ukázal jsou barevný a on má třeba když budu mít

jádro třikrát pixly tak tuhle chvíli bude mít a tři barvy

ho se to spočítat dohromady na těch třeba do

a který s

a tady ty další vrstvy těch koaličních sítích

těch ti

těch kanálů těch konvoluci mají mnoho

no svaté jste síti té první vrstvě je čtyři taji čtyřicetosm druhu neuronů čtyřicet osum

různých kontrolu

každá třeba extrahuj

jindy jiných radisto obrázku který jdou jiný směr je tedy vztahu třeba barvu jaká tam

na tomhle místě a podobně

a každá ta konvoluce bitva pixl nějakou jinou informaci

co je pak máte obrázek dave každým kanálů máte nějaký druh takovéhle informace

pak když jsou další vrstvy

takže ty

konvoluční filtru jsou velký

špatně ono vždycky zpracovávaj všechny ty kanály té vrstvy předtím naráz

a to znamená že tady tyhle filtry

té dalším roste už třeba maji rozměr pět krát pět

ale sou přes všechny ty kanály té vrstvy předtím při všech těch čtyřicetosm kanál

a zas pak

takže ušlo zpracovali víc

mají

kódují vpodstatě složitější informaci

tak těch kanálů těch hlubších vrstvách té sítě bývá nic

a tady na začátku třeba jsou hrany tech těch

směru hran až tak tolik není

ale když přijdete dál jste sítí

tak

tam jsou reprezentace

třeba konkrétních typu objektu s třeba a

ok a nosu

první adept takových objektů že jsou tisíce

to znamená že těch kanálů těch různých konvoluci tam musí být mnoho prostě se nám

mohli naučit detekovat všechny ty různé věci které tom obraze můžou být

už máte na úrovni abstrakce

to jsi z biologie resistor jako je nějaká taková jako

teoretická otázka

existuje

a mozku někde neurony ktery tomu se říká grant na program modern neurony

stě neuron který by reprezentoval vaší babičku

co se týče mozku tak je

taková jako obecně přijímaná teorie že nám funguje podobně jako tady ty neuronové sítě

a to vtom smyslu jak kdyby když něco vnímáte

tak dopravy na začátku

sou

podobné jednoduché filtrech co tady které detekuji hrany

to doopravdy na sítnici

pak jsou a

se celej ten vizuální proces

funguje

dopředně to znamená že tam je třeba to detekce hrana pak je to doopravdy další

vrstva která už těch hran skládá něco složitějšího pak další vrstva další vrstva další vrstva

to se celkem ví a dopravy to odpovídá tomu jak tady ty neuronový sítě fungujou

co se nevím jak to je co se děje dál

co se děje už na takové úrovni kde čili přemýšleli o abstraktních věcech typu auto

můj pes babička

sou o mozku

a neurony které se aktivovaly když vidíte vaší babičku

pravděpodobně a na jako ukazuje se jaksi ano se na ukazuje se to samé ten

těch konvoluční sítí tam dopraví když něco trénujete

tak můžete někde najít neuron

kterej odpovídá automobil

a jí se to třeba na detekci automobilu neučil

tak

další věc která těch

kdyby jste někdy něco s tlakovou činnosti a začli dělat tak kromě konvoluci

tam budou ještě půlím vrstvy

což

přes na cizí podstatě otto že vy když

bude to zpracovávat nějaký obrázek

si představte že tam máte nějaký ty hrany i když se díváte na ty hrany

tak je celkem důležitý kde ta hra ne

se tahle

vlevo v obrázku pro obrázku to je docela rozdíl

ten tam potřebujete

velké rozlišení musíte vědět kde ty věci sou

ne ve chvíli když pudete

na ty abstraktní věci už budete zachycovat je tam třeba to auto nebo je tam

člověk takže vám jedné na kterým pixl přesně touto je

důležitý je třeba jestli ten člověk stojí vedle auto vedle auto nebo je přetypován autem

ale co když tam

přesná pozice není důležitá

co se dá v těch očích sítích tak tam postupně když se de hloubi ještě

vrstva jak tam se zmenšil rozlišení toho obrázku

a to zmenšování rozlišení jsem se dá pro právě pomocí půlím vrstvy to fakt není

nic jinýho než že zmenšit to zmenšit

velmi často se používá

tak zajímat půlení

se znamená že

tom obrázku z nějakého lokálního okolí se vezme maximální hodnota

a to se dá na výstup

a ten výstup se zároveň s menší

a ve velmi jednoduchá operace

se berou maximální hodnoty

úkoly a vy když použijete a nevím vím na zmenšený obrázku tak je to skoro

to samé

tak ta parcela je celá nějaká neuronová síť

může vypadat například takové

to je konkrétně tasí z roku dva tisíce dvanáct ty zemské další kteří vyhráli ten

míč net

a ste všechno odstartovali

se podíváte tak tady teda

jako revoluční vrstva matku link tak

je to menší jo to je snadněji padesát krát padesát pět krát padesát pět pixlů

takže půlka dvacet sedum k dvacet sedum

zas zase to zmenší témat spojených že ten obrázek reprezentované no jako třináct krát třináct

jaksi láska třináct tady projde pardon slova další matku linka pak tady jsou vrstvy které

se dívali na celý ten obrázek dohromady

sou

ale zamřeme to vždycky lžíce děláte

třeba tady tohle mám vstupní obrázky který sou rozlišení deset padesát pět krát deset padesát

pět

můžete mi menší pak to bude vypadat jinak

a základní ty pravidla jsou

používat poměrně malé končíme si na pak teda pane ty vektory ukážu

na používat

menší těmi sem ty jádra menší

na začátku mi těch a

kanál ní po přijdete hlouběji té síti

těch různých konvoluci těch kanálů krůčcích tam mít víc

a postupně prostě zmenšovat ten obrázek

tohle plochy třeba rozpoznávat jak se na tom obrázku je tak takhle to prostě uděláte

vždycky

ta situace ve skutečnosti jednodušší a já to pak ještě řeknu

když byste sami něco dělali

tak

si nejspíš nebude ten navrhovat tu neuronovou síť

nejlepší cenu

tak je stáhnul si nervously kterou šla trvá někdo přetrvává

já vám ukážu odkud se můžete stáhnout

to si

najít a hledej stáhnout z internetu

a funguje tak dobře jak prostě funguje

a vy to si můžete vzít

a adaptovat ji na váš problém

ad pak to bude dobře fungovat

a v tu chvíli nemusíte řešit

jak tu si tam prostě vezmete tak jak byla

a to je nejčastější postup je s největší šancí že

má to bude fungovat

já to jak tohle poměrně malá si tam má nějakých dva čtyři šest osum devět

vrstev

to je pro těla

tak jaké jsou výhody

pak praktické pokud by se ve koule

si čtyři používat wav dopravy a nebudete chtít udělat rozpoznávači jestli je hudba je jedla

nebo jedovatá pro mobilní telefony

aby se vám co nejvíc zákazník otrávil

tak jako výhoda je že

i když si koupíte počítače do kterého strčíte

nějaký dělník je perlička

tak pro dokážete přes na tom jednom počítači třeba zpracovat víc než sto fotek za

vteřinu

dá prostě

na síti takové jako kterých je kterou se tady ukazoval

obrázek

a zeptat se na ten výstup to můžete udělat stokrát za vteřinu na nějakým ke

perlička že budete mít co je poučka tak třeba desetkrát za vteřinu a pořád je

to relativně rychle

problém je

že když se budete snažit vytvořit svůj vlastní c tak by se tomu

je trochu rozumět

protože ve chvíli když vám to gentleman vám to nebude fungovat

a vy nebudete vědět jak to vevnitř funguje sám velmi těžce bude zjišťovat proč to

nefunguje

ale můžete se třicet aby jste chtěli

a druhé druhý problém může být

že

vytvoření testy může trvat

vy pokuď

pokud by se trénovali takový velký sítě jak ten kazil

úplně od začátku tak

tak klidně trvá na měsíc

a na ten na nějaký aha je dvě poučku

ve chvíli ale

jakmile ale když je teda začnete s nějakou sítí která už existuje

tok peněz zvládnete za hodinu

takže to ten problém s tím

že se to dlouho trénuje není až takovej hroznej že by se můžete použít už

existujících

a je na to

základ je

pokud nechcete čekat moc dlouho koupit si grafickou kartu

protože přece jenom ne když máte nějaké chcete učil takovýto který koupíte do deseti tisíc

tak jako maximální výkon má nějakej

kolik můžeme ject na dvě stě mega flow pust čtyři sta mega fotku něco takovýho

a taky hafo původu

když si když si koupíte nějakou devět set osumdesát a nikdy tak ta zvládne a

tak to je prostě a desetkrát rychlejší a ta tam a teoreticky něko někde kolem

votrav

ve při trénování tady tyhle síti

vy dokážete ty grafický karty využít úplně naplno

stejně tak jako týce počkat

na prostě když máte dvacet tisíc tak je lepší si koupit grafickou kartu než dct

loučka

tak

nemusíte si nic programovat

ale můžete si stáhnout nějaký

natočený přes ten se open source a podobně ale něco co stáhnete a můžete koho

tam můžete se si dělat se chcete

push existující který je dobře odladěný rychlý

flexibilní

a když se to přeložit a tak můžete rovno vítr ano

těch nástroje nikoli

já například používám velmi často kafe

cože asi největší nástroje a nejvíc používaný

a vtom doopravdy je nemusíte skoro nic udělat

jestli no vytvoříte

data set čeho ty data někde musíte sehnat

napíšete si nějakej konfigurační soubor a pustíte binární binárku tady s těma konfigurační soubory vás

datasetem ano se vám to na terén nemusíte nic programu

stejně tak skoro když pak čtu si děláte aušus a u že chcete neco použít

tak skoro nemusej nic programovatelnou pak ukážu a zdá který to dělá a je to

pět řádků pipe

opak tydlenty další jsem tady napsal ty vázáni krása opilý to jsou teda a frameu

roky pro python

tak je toho spoustu umí ale my se tam musíte něco do programu to není

skript binárka kterou byste prostě pře musíte něco napsat

ale zas sou na druhou stranu

možná flexibilnější můžete dělat pokud chcete dělat něco vtipnýho což já nevím jestli plánujete nebo

budete plánovat

tak se tam dál

na nějaký hraní no pokud byla zajímal chtěl byste zjistit jak to vevnitř funguje tak

to ty vázáni která se open typ sou možná lepší

pokud chcete rámec použít kafe

tak samozřejmě myslím se to roznese se chcete dělat jestli chcete klasifikovat dobrá s kým

chcete zjišťovat kde věci jsou na obrázku

a chcete a se s čela obrázky

to sem si to rozmyslet podle to ta síť musí vypadat

musíte si sehnat data

pokud byste chtěli rozpoznávat třeba

lidi otců tak na to těch dat moc nepotřebujete dělám stačí prostě sto fotek souhlas

to fotek a lidí

pokud použijete ušní přetrénované musí tak vám to nejspíš bude dobře fungovat

pokud ten problém bude složitější

tak samozřejmě těch dat potřebujete být

ale jako rozumný počty jsou tak jako

tisíce desetitisíce fotek na něco rozumnýho

minima

a můžete si stáhnout existuje si neuronovou síť

já jsem to a tady dal link na něco semene model vozu

cože

velký repozitáře sítí které jdou přímo nahrát právě do toho kafe

jsou natrénovaný vtom café

a je můžete rovnou používá většinou ty licence vývoj takže se že můžete používat a

její komerčně cítil ty s titanity sítě to trénuje nějaké výzkumné organizace to znamená každá

na rovinu licenci

ale většinou je můžete používat bez omezení

a těch ty sítě které tam jsou tak třeba uměl rozpoznávat jaksi mi lokalizovat objekty

umyju

segmentovat obrázky

kde co je taky

to je jich tam hodně

já jsem se dneska díval tak je tam asi dvacet pět třicet různých sítí

se můžete sám

a když se ta koule si teda stáhnete tak vy můžete jí si jako základ

pro vaši síť a trochu to do trénovat na vašich obrázcích

bude to velmi dobře fungovat

tato neříkám že tohle postup jednoduchej

a dopravy pokud máte nějaký malej souboru obrázku tak to je

a nejlepší postu ten postup který vám dá nejlepší slajd

nejenom že se to rychle na trénuje ale bude tady nevím fungovat pokud nezačnete s

nějakou existující neuronových sítí

no a jestli

já si

a tomhle případě ta průměr a je plus minus přímá

na čem nic máte

většinou když se jo tohle budu přemýšlet jako

tyhle termínech tak je

kolik potřebuju a obrázků na jednu třídu

a když do duše si řeknu že

chtěl bych aspoň padesát obrázku na třídu tak pak bych si řeknou musim to mi

na každou tři takže když budu mi tisíc tříd je to padesát tisíc aspoň

ale

a u téhle utekla s ligace takhle daří jsou jiných problémů

mluv úplně ne

samozřejmě to záleží hodně na tom jak je to problém těžkej

no kolik

a jak je obtížné třeba ty dvě třídy od sebe rozeznat že budu mít to

jednoduše rozeznatelné přidělat sebe

tak ti obrázku potřebují je složitě obtížně ty objekty byl podobný tak tě obraz bude

potřeba víc

ta jedna věc druhá věc je když

akce se možná důležitější

tak je že musíte jste trénovací set zachytit veškerou ose ty variabilitu toho těch vašich

dát já když co bude rozpoznávat dotace to za ty z auta

a budu mít trénovací sebou dobrou fotky nám zepředu tak to bude fungovat jenom zepředu

a nebude to fungovat zezadu

z vrchu

a když budu mít ty židle

tak a prostě detektor šli do potřeboval mnohem víc trénovacích dat protože židle vypadají každá

úplně jiná tvrdit dodělat detektor aut protože auta vždycky mají světlomety mají dveře mají kola

ty prej plus mínus stejně

tady ty že nemůžou každá pro doplnění

a ta tam jako konkrétní odpověd nejde říct a zavřený vždycky když budete mít zdát

tak to bude fungovat líp

a většinou to funguje

takže

když budete mít že a budu mít padesát obrázků

a ve seženu sis to

tak to bude mít tak jako dosáhnu stejného zlepší jako když si myslí že vstal

seženu dvě stě

vy ste těch dvě stě čtyři sta let takhle jako wifi exponenciální žert

a dycky zdvojnásobím velikost ne trénovací sady tak se to o nějaký kousek zlepší

a je pak

když to pak chcete dokonalý tak ty dat tak potřebujete vědět

určitě

té pravé ten renovaci algoritmus

a ten vlastně všechny trénovací algoritmy pro ty neuronový sítě fungujou takže dělají graf hlavní

směry

ale prostě maji

teďka nějakou aktuálně natrénováno síť

to trochu změnil a to zas trochu změní a zas trochu změnil

list samozřejmě můžete dělat

když třeba

právě

to umožňuje to hraju přímo to že když máte nějakou existující c teďka v začnete

trénovat trochu něco jinýho

todle když máte nějaký data se řadím prostě jste to někdy na trvá a trvá

síť

nedělám přibyde tisíc další obrázku takže prostě přidáte do té datové sady a do trénujete

dokonce můžete dělat takový věci

takže

a už máte nějako natrvalo síť a máte to někde tužku štyry

jak se dá zjistit když si ten klasifikátor není ste vy můžete mít člověka

tady se podívá

to ste zkontroluje ty

obrázky na kde se ten klasika to není stejný

určitě večeře udělat to i kdybych já byl google

tak on to možná tak dělaj

jak prostě

a příde obrázek paní pustím neuronovou síť

když násilí státech řekl oukej když ne jak se to pošle do indie tam někdo

klikne

ale chvíli když na to někdo klikne jak jsem to přidali trénovací sady

a příště vyšší ta neuronová síť to tohle rozpozná

a toto let a jestli manévrování na s těma kde krásně aut

to je částečně to celá sem tady ukazoval někde

ale jenom částečně

tak

za sem ukazoval tady

a to je

když máte malou neuronovou síť tak vono vám dokáže

takhle protože ona nemůže udělat nic jinýho tak ona vám spojky

a ty data který vidíte nějak jednoduše

když máte velkou neuronů si dělá se tam dokáže dělat všechny možný kejkle

takhle se prostě na fitu je přesně na ty data

ale cokoliv jinýho ten anonymní rozpoznat

tomu se říká přetrénovat

u těch konvolučních si tím o kterých mluvím já

tak to v podstatě nedochází

nebo aspoň a mnohem méně výrazně nižší kdybyste neměli končí c

protože

tak z několika důvodů

tehdy když máte nějaký ten filtr tak ty filtry sou poměrně malý stihne je málo

parametrů a jsem ti košile na obrázku

se znamená že voni podstatě vijou spoustu dal na to aby se to natrénovali

to jedna věc

takže korupční sítě obecně se méně před trénoval jdeš

jako hučí sítě

druhá věc je

že vy když vezmete už nějakou přetrvalo síť která je prostě na trénovaná na

a desítkách miliónů obrázku někým

tak nám se naučí detekovat všechny ty hrany a ty složitější věci a složitější věci

a ona voš podstatě na trénovaná tak dobře dokázalo rozpoznávat věci obrázcích

to je když by to nenapadlo trénovat a na konci tak podstatě

děláte něco takovýho jako že

a jsou jaké kousky mají být na obrázku aby mohl říct že tam pes

a tomu že pak poměrně jednoduchý úkol

a je tam menší prostor pro to aby se ty sítě přetrénovat

samozřejmě se to stane

ale ne

není to nějaký výrazný problém chtěl sítích

samozřejmě použil jsem metody jak tomu zabránit a co má nějaký regularly za cest tyhle

s tím o kterých mluvím já tak tam je tam jsou prostě kterým se říká

drop out

ty přitom trénování náhodně nastavují a neurony na nula

to znamená že ta sídle nemůže jí tu jako spoléhat na to že nějaký neuromancer

nenastaveny musí být robustnější a tak

a jako obecně to funguje relativně dobře samozřejmě čili celá teda s těmi to funguje

nějaký dotaz

tak

a to je rychle projdu

máme z tech pět minut

nebo něco takovýho

co se dá skončím asi těma dělat

můžete

detekovat objekty

a tady tomhle případě jste dělali nevzali

výřezy obrázku vždycky na to pustili neuronovou síť na ten výřez která se to wifi

člověk není tady člověk

a když to neuděláte na dostatečně počtu výřezu obrázku tak dokáže to najít děti

a můžete

ty sítě jsou konvoluční to znamená že vy se tady

jako spočítat všude obrázku

a můžete mít výstup

přímo jak pro každý pixl co na ně mě

takže nejenom

co je na obrázku případně kde ty objekty sou

ale pro každý pixl můžete mít informaci

co to je jakým objektu náleží

můžete dělat

úplně divně jako

věci které já bych řekl že můžou fungovat ale kupodivu fungují

můžete si říct a tenhle obrázek s člověkem

konvoluční sítí a řekni mi kdo má ruce nohy hlavu

můžete mi teda vstup obrázek a výstup klidně pozice no x y pozice kloubů

tohle se třeba používáte zarovnání obličejů a vstupem je obrázek obličeje výstupem sou body na

tom obličeji pomocí toho se to pak třeba ten většina pootočit rozeznávat

to sem dal například já

proto tu

tady ty pozice

znamená že výstupem té neuronové sítě sou nějaký

a reálný čísla který říkají pozice těch logů

sem dal hrátek

jsem použil to samé akorát jsem si řekl co když výstupem té sítě bude obrázek

hodnoty pixlu toho obrázku

co s tím udělat s ta koule sítí tak co třeba

když mám ten vstup nějaké rozmazané i ta chtít po síti aby se to rozmazaný

obraz dala skinu práce

takže já mám síť

kde vstup je obrázek výstupem obrázek

a ta síť ho od rozmazává

to funguje krásně vás to někoho zajímalo mám na netu tyhle sítě nahraný někde když

se podíváte na moje stránky

a pak můžete dělat takový že tady mobilem si fotit nějaký text

a ta síla se udělá něco co dokážete přečíst když ten zkuste přečíst životě nedokázali

kdyby se to někdo chtěli koupit dejte vědět

tráva a jak jsem říkal ten zvuk rozpoznává obličeje

placení dělají tak a

na fotce obličej najdou teda ty body

a uměle ten obličej otočil dopředu

a teď trochu složité a tom

můžete se podívat

a pak takhle na obličej které otočili a dopředu abych se díval do kamery tak

na to prostě ukončí neuronovou síť ste neuronové sítě

na konci vezmu nějaký aktivace které reprezentuje ten obličej vypadá

a pak maji takovéhle vektory ty deaktivaci s to ze vše z nějakého ty databáze

pak když přijde nová fotka s akorát podivaj tohleto vektoru databázi chce nejblíž a to

je ten člověk

dokonce můžete trénovat

ne sítě na rozpoznávání nebo na rekonstruovat něčeho

ale klidně můžete trénovat sítě

rovnou na tobě říkali že ten se podobný

jestli takzvané syrské sítě

se s na vstupu sou dvě věci

se pro ženu nějakou

sítí které můžou být by měl být stejně rozdílem na konci jedinou nějaké

vektory čísel

a ta sice dá trénovat tak

aby přímo

se trénoval že

stejný

obrázky holky že na těch obrazů sem třeba stejný člověk

tak aby ty vektory byly stejný a pro různé lidi aby ty vektory ty reprezentaci

byly a co nejrůznější toho se dá třeba vím že když dopravy děláte nějaké vyhledávání

indexaci

a podobně

a máte jako databázi

třeba videí

a budete hledat

nejpodobnějšími den

takhle domu natrénovat ty

fingerprint i ty obrázky patra ty vektory podle kterých viz vy vyhledávat at podobný věci

nejsi dělat

to má

nuly

málo zručný technický problém

tohle když kolik

nejsem trénovat neuronové sítě které dokonce jenomže zpracovávají celý

obrázek ale naučil se kam se na tom obrázku dívat

a tohleto při vidíte ty čtverečky

to dopravy ta síť se naučila že rozpoznávač číslo tak se někam dívej

a pak dokonce tady podle těch síti

toto chcete

a to toho trochu dýl

to co je tady na tomhle obrázku takže

že nejenom že ta síť se naučil rozpoznávat ty číslice ona se nám členy kreslit

no to je to stay vidíte tak to je proces kdy neuronová síť

generuje a

how snad brzd nebo takový ty čísla co na práci

a nedělat

dudy generovat i další věci

úplně úžasný článek ne nečekal bych že o tom

jo tím že čekal že

uvidím někde článek o generování židlí pomocí neuronových sítí a tady ti lidi natrénovali síť

které řekli na generuj mi síť typů pět

s pohledu odtud

a ta síť to wiki vytvořit a jít ale obrázek

spajdrmen

jak ono to vypadá tak trochu podivně a podstatě relativně dobře

mimo jiné co můžou dělat tak vidíte tady takže interpolovat mezi různýma ty považuji

se mají

můžou vygenerovat obrázek židle která je napůl křeslo a napůl kancelářská židle

a není to fotorealistickými ale

takové věci se dají dělat

a samozřejmě

máte náladu tak se můžete podívat na nějaká já vím

a seš

jak jsem říkal

postupech tohle se vytváří takže nějaká trénovaná si teda chtěl bych se vpodstatě můžete sto

internetu s tou malou zůstanou

paní lates na vstup to jestli tě nějak i obrázek

pro ženete to tou sítí

a teďka

si řekne řeknete jestli ti třeba

já bych chtěl aby ten obrázek vybral víc jako pes

a to je tohle informací můžete pak spát pro potom o propagovat stejně jako

přitom učení těchhle pomoci backpropagation místo není varech

může to mění ten původní obrázek

a to co vidíte tady

tak to je

jak

sem

kontinuální

to vstupního obrázku tak aby

a by se nějaká aktivace té neuronové sítě byla vysoká

a to na začátku to byli

jako abys

byly vysoké aktivacím nějaké prvním místě

a tohle postupně

a jo tam se viděli že tam byly hodně ran

tak jsem někde hlouběji ste síti

oženíte že tam jsou

očí

a vlasy

podstatě psů a podobně už jako takový částí objektů části tuhle chvíli zvířat

tady jsou a je nějaký lidský voči

když pude

a postupy když tady pro ty vím trims použijeme aktivace té hlubší ve slipech tak

začnete vidět větší kusy objektu a tady jsou stě hlavy

teda bude něco jinýho než oči

tady jsou nějaký monitory a podobně

ad to vpodstatě ta síť

se říká že na lucinu je

a vymýšlí si vytváří obrázky tak aby je hodně aktivované

je možný že vy když velcí ne tak to funguje podobně

doporučuju tady ten ničemu kdy vy můžete se můžete si večer udělat párty

nepouštěj malým dětem spaní

a tady na to zas a pro kafe

existují a jako peníze si můžete si stáhl python skripty které využívají kafe

a dělal

dělají přesně to

běžte nějaký dochází čas takže

existuje nějaké datasety

pokud budete se má končíme si těma chtít začít

tak se podívejte na kafe to teda obrovský projekt moudrosti relativně velký projekt

a je na githubu

nejsem můžete podívat jsem včera tímto z netu a skoro čtyři tisíce forku

a za poslední týden tam je

se merge oval opět tu půl requestu

prostě žije existuje kam to velká komunita

a vtom kafe

doopravdy vy si můžete vytvořit

textový soubor kde dáte jména souboru na obrázku a jejich třídy

vytvořit

konfigurační soubor toho trénování můžete vytvořit soubor který definuje tu síť

a pustit říkáte kterej ne

moji síť

ale se bude trénovat najděte uč kluk

ano

levicové pane nějaký konfigurace

a tady se píše o takový

ty konfiguraci tady prostě takhle

tak konfigurace trénování vypadá takhle

a takhle se to dá používat slajd

no tohle celý to

kde byla načtete nějakou si

a pustíte ji na nějaký obrázek dostanete se

tak já vám děkuju tady tahle tu prezentaci někam tam

určitě

a zajímá zdroje nás něco zajímalo podívejte se na

Konvoluční neuronové sítě

Sobota 7.11.2015 - D105

Michal Hradiš (FIT VUT v Brně)