AI přepisy s Whisper a Cesky.ai, novinky v AI a Python slovníky v praxi (leden 2024)
Přehled nejnovějších zpráv, nástrojů, tipů v oblasti AI a programování, které by vás mohly zajímat.
Tento měsíc byl pro mě nesmírně nabitý. Na svém YouTube kanále jsem se pustila do svého prvního rozhovoru a to na téma manuálního testování. Hostem mi byla Lucie Tvrdíková a musím říci, že obě nás to natolik nadchlo 👏, že jsme rozhovor musely rozdělit do dvou dvouhodinových dílů.
Zároveň byl zahájen můj kurz Pythonu 🐍. Všechno funguje na jedničku, studenti jsou s kurzem spokojeni, což vyplývá z jejich pozitivních ohlasů, a já jsem nadšená z toho, že mohu pracovat na něčem, co je úplně mé 😊.
Plánuji verzi kurzu, která nebude zahrnovat live workshopy a bude se skládat „pouze“ z videí (cca 10 hodin) 🎥, necelé stovky úkolů ✍️, doplňujících odkazů 🔗 a samozřejmě podpory a komunity na Discordu. Tím bude kurz dostupný za mnohem příznivější cenu.
A určitě vás zde o tom budu informovat.
Tip pro nadšence Gitu: Začala jsem díky Obsidianu verzovat své poznámky (plugin Obsidian Git).
Překvapuje mě, že mě to nenapadlo dříve. Takže pokud ovládáte základy Gitu, určitě bych to doporučila 👍. A pokud ne, mám pro vás samozřejmě YouTube videa na téma Git.
🚀 Nejnovější informace ze světa AI 🚀
👉 David Slížek z portálu Lupa nahlédl do světa umělé inteligence v roce 2023. V jeho článku "Rok 2023 v AI" najdete podrobný přehled 🌐, který zahrnuje i odkazy na vývoj multimodálních modelů, regulační změny a soudní spory v oblasti AI. Přečtěte si ho a získáte ucelený obraz o aktuálním dění v tomto rychle se vyvíjejícím odvětví.
👉 Společnost Midjourney se chystá přinést novinku v oblasti AI - model převádějící text na video 📹. Očekává se, že tento model bude zpřístupněn veřejnosti během několika nadcházejících měsíců.
👉 Na sociálních sítích se objevil seznam obsahující jména 4700 umělců, jejichž díla byla využita při trénování modelů Midjourney 🎨. Podle informací, seznam není ani kompletní. Tento seznam se stal součástí žaloby skupiny umělců proti společnostem jako Midjourney, Stability AI, DeviantArt a Runway AI, které jsou obviněny z neoprávněného používání uměleckých děl.
👉 Pavel Kasík ze Seznam Zpráv se ponořil do světa Midjourney a provedl několik srovnání různých verzí této AI. V doprovodném článku se věnuje historii 🕰️ a technickým aspektům generování obrázků pomocí AI, nejen v rámci Midjourney.
👉 OpenAI spustila GPT Store, platformu umožňující platícím uživatelům ChatGPT přístup k různým verzím GPT. Najdete ji v levém sloupci pod sekci "Explore GPTs".
👉 V České republice byly vyneseny první rozsudky, které se týkají autorských práv a umělé inteligence. Detaily k těmto případům naleznete v článku na Lupa.cz.
👉 Microsoft představil Copilot Pro, nové předplatné pro jednotlivce. Tato služba integruje AI do Microsoft aplikací a nabízí prioritní přístup k nejnovějším verzím AI modelů 💼. V ČR by měl být Copilot Pro dostupný v následujících měsících.
👉 Chcete lepší přehled o tom, co různé společnosti nabízí v oblasti umělé inteligence? Pavel Kasík ze Seznam Zpráv vytvořil srozumitelný přehled, zaměřený na nabídky pro jednotlivce a firmy, včetně informací o prozatímním nenasazení Microsoft Copilotu Pro v ČR.
👉 Seznam.cz pracuje na vlastním jazykovém modelu umělé inteligence, který by mohl znamenat velký krok vpřed pro práci s českým jazykem.
💡 Tip na ChatGPT příkaz 💡
Na zajímavý ChatGPT příkaz jsem narazila na twitteru Josefa Šlerky.
🛠️ Zajímavé AI nástroje 🛠️
Tento měsíc jsem se podívala na nástroj cesky.ai.
Cesky.ai je webový nástroj, který umí převádět mluvené slovo z audio a video souborů do psaného textu🎙️. Používá k tomu umělou inteligenci. Snaží se o to, aby přepis byl co nejpřesnější a zachytil všechny nuance češtiny.
Tento nástroj jako mnoho jiných využívá Whisper na transkripty a poté dělá dodatečnou korekturu (předpokládám, že pomocí OpenAI API) 📝. Můžete tak získat kvalitní (posuďte níže) přepisy například videí či podcastů.
Má to jediný háček. Hádejte jaký? Cena💰.
Ano, jsou zde na vyzkoušení dvě hodiny zdarma, což je fakt hodně. Jenže každá další minuta stojí 3 koruny, takže každý hodinový podcast by vás vyšel na 180 Kč.
Pokud potřebujete gramaticky správný transkript videa, které má pár minut, myslím, že super řešení👍. Také to asi budu využívat k mým krátkým videím.
Ale pokud byste to chtěli používat na přepisy zmíněných podcastů, abyste si z nich pak například mohli dělat poznámky, tak to asi ne...🤔
Každopádně, je zde varianta zcela zdarma, prostě si nainstalujte Whisper. Našla jsem k tomu velmi podrobné video.
Já sama tento model využívám na transkripty ke svým videím a úprav bylo vždy jen pár. Asi i proto, že ve videích nemám dlouhá 'ticha'🤫, protože pak Whisper model vkládá různé reklamy a poděkování.
Níže je ukázka přepisu z mého videa, oba nástroje dostaly stejnou zvukovou stopu a stejné doplnění (u Whisper je to možnost --initial_prompt, u cesky.ai pak kolonky na téma a neobvyklá slova).
Zde ukázka z cesky.ai včetně korektury, kterou nástroj provádí:
Víte, že díky množinám můžete získat unikátní seznam například e-mailů a to rychle a efektivně?
Ale to není vše. Představte si, že máte seznam e-mailů z dvou marketingových kampaní a potřebujete najít e-maily, které jsou společné pro obě kampaně.
A i přesto, že jsou množiny velmi efektivní a užitečné, jsou pro začátečníky málo využívány.
To není se čemu divit, protože často ve studijních materiálech nejsou množiny probrány vůbec nebo jen okrajově a jejich výhody jsou nedostatečně vysvětleny.
Pojďme se tedy společně podívat na to, co to množiny jsou, proč jsou tak efektivní a jak mohou být využity.
Množiny jsou kolekce jedinečných hodnot, což znamená, že každá hodnota v množině se může vyskytovat pouze jednou.
Díky tomu se můžeme jednoduše zbavit duplicit. Zde vidíme, že i když jsme do množiny Player IDs vložili identifikátor 101 několikrát, výsledná množina ho obsahuje jen jednou.
Množinu vytvoříte pomocí složených závorek.
Dalším klíčovým aspektem množin je to, že jsou neuspořádané.
Zde ukázka pomocí Whisper (model large):
Víte, že díky množinám můžete získat unikátní seznam, například e-mailu, a to rychle a efektivně?
Ale to není vše. Představte si, že máte seznam e-mailu z dvou marketingových kampaní a potřebujete najít e-maily, které jsou společné pro obě kampaně.
A i přesto, že jsou množiny velmi efektivní a užitečné, jsou začátečníky málo využívány.
Ono není se čemu divit, protože často ve studijních materiálech nejsou množiny probrány vůbec, nebo jen okrajově a jejich výhody jsou nedostatečně vysvětleny. Pojďme se tady společně podívat na to, co to množiny jsou, proč jsou tak efektivní a jak mohou být využity.
Množiny jsou kolekce jedinečných hodnot, co znamená, že každá hodnota v množině se může vyskytovat pouze jednou.
Díky tomu se můžeme jednoduše zbavit duplicit. Zde vidíme, že i když jsme do množiny player IDs vložili identifikátor 101 několikrát, výsledná množina ho obsahuje jen jednou.
Množinu vytvoříte pomoci složených závorek.
Dalším kličovým aspektem množin je to, že jsou neuspořádáné.
🐍 Python Tipy 🐍
V této části newslettru jsem se rozhodla udělat malou změnu.
Namísto toho, abych vám zde poskytovala příklady Python kódu, rozhodla jsem se, že je budu umisťovat na Replit, kde si je budete moci ihned vyzkoušet👩💻.
Stačí se zaregistrovat na Replitu. Poté kliknout na tento odkaz a vpravo nahoře zvolit možnost Fork&Run. Tím se kód zobrazí na vašem účtu a budete moci jej upravovat a spouštět.
Dnes se zaměříme na základy práce se slovníky. Zkuste odhadnout, co každý příkaz print vypíše, a teprve poté program spusťte🤔.
Měli jste ve své odhady správně?
📰 Novinky u mně 📰
V tomto měsíci jsem vydala dvě videa na téma manuálního testování. První video bylo zaměřeno obecně na testování a na to, jak a kde se lze naučit manuální testování.
Druhé video pak bylo zaměřeno na pracovní trh a na pohovor samotný.
Do budoucna mám v plánu další rozhovory. V plánu je zhruba jednou za dva měsíce.