Daniel Shenfeld Data Science Executive / Machine Learning & AI Strategy Consulting

Czego nauczyłem się z 12 startupów machine learningowych

Poznaj 8 rad, które pomogą Ci skuteczniej zarządzać procesami Machine Learning, Data Science oraz AI.

26.01.20205 min

Techniczne Nietechnicznie o IT Rozwój i Kariera

Czego nauczyłem się z 12 startupów machine learningowych

Pracowałem z 12 startupami. Ich pola działań sięgały od fintechu i opieki zdrowotnej po edukację i biotechnologię, od dopiero kiełkujących po startupy gotowe do rozpoczęcia działań lub gotowych pod inwestowanie. Moje role również się różniły, od pracownika “od wszystkiego”, który rozwiązywał “najbrudniejsze” problemy, do kierownika od Data Science i doradcy strategicznego. We wszystkich pracowałem nad interesującymi problemami z uczeniem maszynowym i Data Science. Każdy z tych startupów starał się budować świetne produkty. Wielu się udało.

Oto, czego się nauczyłem.

Chodzi o budowanie produktów, a nie AI

Jako matematyka, początkowo najbardziej motywowała mnie nauka uczenia maszynowego i wyzwanie polegające na wymyślaniu nowych, kreatywnych algorytmów i metod.

Ale szybko zdałem sobie sprawę, że nawet najdokładniejsze modele uczenia maszynowego nie tworzą wartości na własną rękę. Wartość uczenia maszynowego i sztucznej inteligencji mierzona jest w kontekście produktów, które zasilają. Dowiedzenie się, jak to zrobić efektywnie, to tak naprawdę dowiedzenie się, na czym dokładnie polega budowanie produktów napędzanych ML.

Ważny jest problem, nie metoda

Jeśli celem jest zbudowanie produktu, uczenie maszynowe i sztuczna inteligencja są środkiem do celu. Liczy się to, jak dobrze rozwiązują problemy dotyczące produktu, a nie to, jaką metodę stosujesz. W większości przypadków szybkie i “brudne” rozwiązania pozwolą Ci dotrzeć całkiem daleko. Nie baw się w głębokie sieci neuronowe, gdy prosta regresja daje radę.

Kiedy koncentrujesz się na problemie, możesz czasami odkryć, że uczenie maszynowe nie jest właściwym narzędziem do jego rozwiązania. Wiele problemów dotyczy samego procesu. Nawet w takich sytuacjach naukowcy zajmujący się danymi mogą wnieść dużą wartość, ponieważ w naturalny dla siebie sposób podejmują rygorystyczne, oparte na danych podejście. Ale to nie sprawia, że naprawianie złego procesu za pomocą sztucznej inteligencji jest dobrym pomysłem. Najpierw napraw ten proces.

Szukaj synergii między danymi a produktem

Prawdziwa wartość uczenia maszynowego rzadko pochodzi z przyjęcia istniejącego produktu i przyporządkowania go prognozom z modelu uczenia maszynowego. Oczywiście, doda to trochę wartości przyrostowej. Ale w silnych produktach AI, uczenie maszynowe nie jest tylko dodatkiem. Jest to cały silnik tworzenia wartości, a produkt jest zbudowany z myślą o silniku. Produkt i dane muszą działać synergicznie.

Gdy wszystko dobrze działa, uzyskuje się potężny cykl, który nazywam dopasowaniem produktu/danych. Produkt skutecznie wykorzystuje potencjalną wartość danych, jednocześnie generując dane niezbędne do dalszego ulepszania produktu.

Sztuczna inteligencja nie może po prostu pozostać zagrzebana w zespołach zajmujących się nauką danych i inżynierią. Inne części organizacji, od produktu do szczebla kierowniczego, muszą być zaangażowane w rozmowę, aby przyspieszyć proces tworzenia wartości. Wymaga to dużej ilości nauki i zaangażowania wykraczającego poza to, do czego inżynierowie są zazwyczaj przyzwyczajeni w budowaniu oprogramowania, nawet w startupie.

Najpierw dane, później AI

Uczenie maszynowe i sztuczna inteligencja wymagają dużej ilości danych, a co ważniejsze, wysokiej jakości danych. Jeśli budujesz produkt od podstaw, pomyśl o zbieraniu danych już od pierwszego dnia. Jeśli wprowadzasz technologie sztucznej inteligencji do istniejącego produktu, przygotuj się na znaczne zainwestowanie w inżynierię danych i przystosowanie aplikacji, zanim zajmiesz się kwestiami AI.

To nie znaczy, że musisz zrobić to wszystko przed wyciągnięciem jakiejkolwiek wartości. Lepsze operacje na danych oznaczają lepszą analitykę, co jest kluczowe dla każdej organizacji, aby się ciągle uczyć i ulepszać produkt. Wykorzystaj to, aby zademonstrować wartość i wkupić się tym w ogranizację. A kiedy Twoja analityka jest już naprawdę solidna, jesteś gotowy, aby zacząć myśleć o uczeniu maszynowym.

Zainwestuj w skuteczną komunikację

Budowanie świetnych produktów wymaga świetnych menedżerów tych produktów i wsparcia ze strony kierownictwa. Podczas gdy wielu jest wabionych mocą sztucznej inteligencji i deep learningu, niewielu ludzi nietechnicznych naprawdę rozumie te technologie. Skuteczna dyskusja na temat uczenia maszynowego i AI, wymaga znacznego zrozumienia statystyk. Tworzenie się luki komunikacyjnej często prowadzi do nierealistycznych oczekiwań w projekcie.

Jedną z kluczowych strategii jest utrzymywanie ciągłej rozmowy na temat metryk biznesowych i ich przełożenia na metryki modelowania. To nakłada dużą odpowiedzialność na menedżera produktu, ale także na naukowców zajmujących się danymi, którzy muszą rozwijać wiedzę w dziedzinie i głębokie zrozumienie zagadnień biznesowych, aby ich działania były naprawdę skuteczne.

Szybko i “brudno” nie jest tak naprawdę “brudno”

Jak już wspomniałem powyżej, szybkie i “brudne” metody pozwolą Ci dotrzeć całkiem daleko. Po części dlatego, że dzisiejsze szybkie i brudne to wczorajsze, powolne i precyzyjne. Narzędzia takie jak word2vec stały się prawie tak łatwe w użyciu, jak regresja, a nowe potężne narzędzia, są stale wprowadzane. Solidne zrozumienie różnych elementów składowych i połączeń między nimi, jest niezbędne dla każdego naukowca danych.

Jedną z konsekwencji eksplozji narzędzi open source jest to, że w większości przypadków tworzenie własnych platform machine learningowych nie jest dobrym pomysłem. Oczywiście, powinieneś mieć własne algorytmy, które wykorzystują dobrze znane bloki konstrukcyjne i dostosowują je do Twoich problemów i domeny. Ale pozostaw badania deep learningu osobom w Google - skup się na problemie biznesowym.

W razie wątpliwości pokaż dane

Najważniejszym działaniem na wczesnym etapie rozwoju produktu jest zebranie informacji zwrotnej od rynku. Ale uczenie maszynowe wymaga dużej ilości danych, a zdobycie tego zajmuje równie dużo czasu. Stanowi to problem: jak uzyskać wgląd w dane na temat produktu do przetwarzania danych bez posiadania dużej ilości danych?

Najlepszym rozwiązaniem jest częste wyświetlanie danych Twoim użytkownikom. Ludzie mogą przetwarzać tylko małe ilości danych na raz, więc nie ma znaczenia, czy nie masz ich jeszcze zbyt wiele. W jaki sposób użytkownicy angażują się w dane, które im pokazujesz? Gdzie chcą głębiej kopać? Udostępnienie informacji, które wcześniej były niedostępne, może być bardzo ważnym krokiem i dać Ci cenne wskazówki na temat potencjalnej wartości biznesowej Twoich danych.

Buduj zaufanie

Zaufanie jest głównym czynnikiem sukcesu większości technologii. Ostatecznie każda technologia jest używana przez ludzi i musi mieć ich zaufanie. W kontekście aplikacji do uczenia maszynowego, niektórzy z tych ludzi mogą obawiać się, że ich praca zostanie zautomatyzowana. Inni polegają na informacjach dostarczonych przez Twoją technologię, aby podjąć ważną decyzję.

Produkt AI, który łączy te obawy, np. poprzez podejmowanie decyzji za człowieka, a nie wspomagającego podejmowanie decyzji, doprowadzi do szybkiej utraty zaufania.

Zaufanie jest łatwe do stracenia i trudne do odzyskania. Buduj produkty, którym ludzie zaufają.