Alexa: Ai w domu (Amazon Echo Dot 2)

Smart już było, teraz czas na AI – Artificial Intelligence. O Sztucznej Inteligencji (SI) mówi się wiele, zresztą nie od dzisiaj. Jedni widzą w niej przyszłość – inni twierdzą, że to właśnie rozwój AI może doprowadzić do… coś jak zagłady ludzkości:) Mimo tego powstają ‚inteligentne’ pralki, lodówki, samochody – czy inne jeszcze groźniejsze urządzenia w stylu szczoteczek do zębów.

Alexa, are you Skynet?
I have nothing to do with Skynet. Don’t worry

Ja też uległem i w domu pojawiło się Amazon Echo Dot (v2).

Urządzenie to znajdziecie najczęściej w kategorii ‚głośnik przenośny’. Faktycznie – do Echo Dot możecie się podłączyć za pomocą bluetooth i odgrywać przez niego muzykę. Ale Echo ma też wbudowane WiFi i siatkę 7 mikrofonów… Bo to Echo nie tylko powtarza, ale słucha – i odpowiada:) 

Sterowanie głosowe nie jest pomysłem nowym. W założeniu ma ono ułatwić interakcję człowiek-maszyna. W praktyce – sami wiecie, różnie bywa. Głosowe wybieranie numeru w samochodzie jest bardzo przydatne. W telefonie… coś nie bardzo mi pasuje. Różnie bywa też z jakością rozpoznawania mowy, zwłaszcza w systemach, gdzie algorytm porównuje podsłuchaną próbkę do pewnego zapamiętanego wcześniej wzorca (zob. np. Arduino słyszy głosy)

Echo Dot potrafi robi to inaczej. Próbki głosu przesyłane są na serwery Amazona (usługa nazywa się AVS – Amazon Voice Services) i tam przetwarzane przez odpowiednie oprogramowanie. Wynik odsyłany jest z powrotem na Echo – i na tej podstawie podejmowane są akcje.

Dzięki przeniesieniu przetwarzania do chmury algorytmy rozpoznawania mowy dysponują potężną mocą obliczeniową. Dodatkowo, jeżeli producent ma pomysł na ich udoskonalenie – może to spokojnie zrobić centralnie na serwerach, bez konieczności zmiany czegokolwiek na urządzeniu użytkownika. Samo urządzenie jest w ten sposób tańsze – nie musi zawierać potężnego procesora czy nieskończonej pamięci. Wystarczy, że będzie potrafiło obsłużyć swoje peryferia a przede wszystkim – sprawnie komunikować się z serwerami. Dlatego Echo wymaga podłączenia do sieci.

Z drugiej strony: Echo właściwie słucha cały czas czekając na charakterystyczne wezwanie ‚Alexa’ (lub jedeno z ustawionych przez Was słów ‚budzących’ – wake word). Producent zastrzega, że zapisywane i przetwarzane w chmurze jest jedynie to, co powiedziecie po słowie kluczowym (np. Alexa) i do momentu zakończenia interakcji. Mimo wszystko tego typu urządzenia są przedmiotem dyskusji dotyczących sfery prywatności.

Rozpoznawanie – czyli przełożenie języka naturalnego na postać zrozumiałą dla komputera – to jedna sprawa. Teraz trzeba to jakoś wykonać… Dla Echo służą do tego tzw. skills, czyli ‚umiejętności’. Umiejętności pozwalają przełożyć zinterpretowaną komendę głosową na konkretne działania. Może to być np. uruchomienie odtwarzania stacji radiowej, zapalenie żarówki lub włączenie telewizora na konkretny kanał. Jeżeli więc chcecie dołożyć jakieś nowe urządzenie do Echo – upewnijcie się, że jest z nim zgodne i istnieje dla niego odpowiedni skill.

Gdzie tu ta mityczna sztuczna inteligencja?

Przede wszystkim Echo – a właściwie Alexa – ma ambicję rozpoznawania języka naturalnego. W związku z tym zamiast wydawać komendy jako pojedyncze słowa – z Alexą możecie sobie… pogadać.  Oczywiście, nie chodzi tu o dysputę polityczną na poziomie ‚gadających głów’ (choć to może i dobrze). Ale polecenia Echo wydaje się po prostu mówiąc, czego potrzebujecie. Oczywiście wcale nie znaczy to, że urządzenie w pełni i zawsze zrozumie Wasze intencje:)

Alexa (Echo) posługuje się głównie językiem angielskim. Ale można się z nią również dogadać po niemiecku, francusku i japońsku. Niestety nie dogadacie się po polsku.

W pudełku

Amazon Echo Dot 2 sprzedawana jest w niewielkim kartonowym pudełku:

Na boku pudełka przyklejona jest przejściówka… Trochę to dziwne… bo w środku jest jeszcze jedna…

Przejściówka przyda się do ładowarki. Nawiasem mówiąc… mogłoby to być trochę porządniejsze…

Samo urządzenie ma rozmiar krążka o średnicy 84 mm i wysokości 32mm. Głośnik znajduje się na spodzie. Na górze znajdują się 4 przyciski – regulacji głosu, akcji i wyłączania mikrofonów.

Zamiast przycisków możecie powiedzieć:

  • ‚Alexa, volume up’,
  • ‚Alexa, volume down’,
  • ‚Alexa, set volume to 10’ – od 0 do 10, 10: maksymalna głośność,
  • ‚Alexa, stop’: zatrzymuje akcje Alexy.

Co ciekawe – na boku znajdziecie dodatkowe gniazdo audio:

Uruchomienie

Będziecie potrzebowali:

  • Domową sieć WiFi,
  • Smartphone w tej samej sieci z załadowaną aplikacją Alexa,

Echo zasilane jest przez microUSB. Nie ma wbudowanego akumulatora, więc musicie na nie wybrać miejsce w pobliżu gniazdka AC. Jeżeli zamierzacie go połączyć ze sprzętem audio przez wyjście liniowe (jack 3.5) – musicie zaopatrzyć się w odpowiedni kabel (nie ma go w komplecie). Echo nasłuchuje komend, więc umieszczenie go w pobliży głośników może nie być najlepszym pomysłem – choć muszę przyznać, że Alexa słyszy nieźle.

Najlepiej po prostu postępujcie zgodnie z instrukcją. Echo trzeba jedynie podłączyć do zasilania. Większość konfiguracji wykonuje się w aplikacji na smartfornie. Tam konfigurujecie parametry podłączenia WiFi, skile Echo, podłączenie do innych urządzeń itp.

Echo to ‚zwierzę’ internetowe. Do pełni radości potrzebuje dostępu do internetu. Inaczej jego funkcjonalność będzie bardzo ograniczona.

Przy pierwszym uruchomieniu Echo może oświadczyć, że własnie pobiera aktualizację oprogramowania. Zajmie to chwilę, wymaga restartu.

Ważne jest, żebyście w aplikacji poprawnie ustawili lokalizację. Inaczej Echo będzie podawało Wam np. pogodę na Seattle:)

No to sobie pogadamy…

Alexa, good morning.
Good Morning… On this day…

Alexa nie tylko się przywita, ale poda też jakąś ciekawą historyjkę, która jest związana z obecną datą.

Alexa, play Radio ZET
Radio Zet from TuneIn

…i odtworzy strumień internetowy z Radia ZET. Podobnie:

Alexa, play Radio RMF.

Oczywiście RMF musi być wymówione po angielsku. A jest tak, dlatego że skill ‚TuneIn’ jest zainstalowany domyślnie.

I praktycznie, prognoza pogody:

Alexa, what’s the weather today?
Alexa, what’s the temperature outside?
Alexa, what is the weather forecast for the next 7 days?

Ustawianie alarmu – codziennie o 6:30:

Alexa set an alarm for 6.30 daily
Alexa set an alarm for 6.30 weekdays
Alexa, when the alarm goes off tomorrow?
Alexa, did I set any alarm for tomorrow?
Alexa, list my alarms!

I tutaj taki mały haczyk: alarmy z powtórzeniami traktowane są jako osobna kategoria niż alarmy pojedyncze. Więc, jeżeli powiecie:

Alexa set an alarm for 6.30 weekdays

I spytacie:

Alexa, when the alarm goes off tomorrow?

Alexa odpowie, że nie ma żadnych alarmów.

Można też krok po kroku:
Alexa set an alarm…
Alarm for what time?

Bardzo przydatne są timery:
Alexa set a timer for 3 seconds
Alexa remind me in 3 seconds

Alexa zapamięta Wasze urodziny:

Alexa, remember that my birthday is on the 1st of January
Ok, I will remember that

I śmieszne…

Alexa, I’m your father
Alexa  play rock, paper, scizors
Alexa, red alert!
Alexa, beam me up.
Alexa, fire photon torpedoes

Dodatkowe skille

Katalog skilli zawiera setki pozycji. Dzięki temu za pomocą Alexy (i dodatkowych urządzeń) możecie głosowo zarządzać domowym sprzętem audio/tv, oświetleniem czy urządzeniami podłączonymi do gniazdek sieciowych . Już niedługo kilka z nich wypróbuję:)

Podsumowanie

Alexa/Echo jest w domu od pewnego czasu. Pojawiła się jako prezent na Dzień Ojca, zadomowiła pod telewizorem – i tak została.

Nie jest to oczywiście gadżet pierwszej potrzeby. Na razie pełni głównie funkcje budzika. W tej roli sprawdza się świetnie – wystarczy mruknąć ‚Alexa, stop!‚… i można spać dalej:)

A tak serio – spodobał mi się skill ‚Alexa, give me Flash Briefing’ – podaje ostatnie wiadomości z wybranego serwisu. Możecie przegapić wiadomości np. w RMF FM – Alexa je Wam odtworzy.

Sprawdzają się też zapowiedzi pogody. Na ustalonej w aplikacji smartfonowej trasie można zapytać o ruch na drodze.

Trochę szkoda, że Alexa nie integruje się z dostarczanym przez Play serwisem muzycznym Tidal. Można za to podpiąć np. konto w Spotify. Dzięki temu będziecie mogli wyszukiwać muzykę głosowo. Sam głośniczek może nie jest rewelacyjny – ale też co tu oczekiwać za taką cenę i w takim rozmiarze. Na wakacje nada się świetnie – zwłaszcza, że zawsze można posłuchać radia.

Myślę, że Echo będzie jeszcze ciekawsze, gdy podłączę do niego trochę automatyki domowej. Co opisze już niedługo:)

Zalety

  • Ciekawa interakcja z użytkownikiem:)
  • Tysiące skilli – rozszerzają możliwości urządzenia
  • Podoba mi się design
  • Wyjście do podłączenia zewnętrznych głośników
  • Może pracować jak zwykły głośniczek BT
  • Świetne mikrofony
  • Zasilanie przez microUSB – pasują ‚normalne’ ładowarki od komórek
  • 220 złotych (a można i taniej) – świetna cena

Wady

  • Tylko po angielsku. Z drugiej strony… może Alexa pomoże w nauce języków?
  • Brak zasilania bateryjnego (można kupić podstawki),
  • Brak wbudowanego ZigBee – bardzo popularnego w automatyce domowej,
  • Nie można wyłączyć mikrofonów za pomocą komendy głosowej – w tym celu trzeba wcisnąć przycisk na obudowie

Zapraszam do dyskusji na facebook.

Źródła

  • https://www.cnet.com/news/appliance-science-alexa-how-does-alexa-work-the-science-of-amazons-echo/
  • https://www.cnet.com/news/alexa-star-trek-discover-skills-amazon-echo-klingon-trivia/