Artykuł pochodzi z wydania: Luty 2024
Generatywna sztuczna inteligencja (GAI) zmienia sposób, w jaki korzystamy z komputerów. Na przełomie 2022/2023 roku ChatGPT stał się usługą o najszybciej rosnącej liczbie użytkowników i przyspieszył badania nad modelami GAI. W roku 2024 podobny sukces mogą odnieść inteligentni asystenci. Celem artykułu jest przedstawienie jednego z nich, czyli usługi Microsoft Copilot – zasad jej działania i technik pozwalających w pełni wykorzystać jej możliwości.
Microsoft zaprezentował na konferencji Ignite 2023 szereg nowych usług i funkcji z zakresu sztucznej inteligencji mających na celu ułatwienie tworzenia i wdrażania zaawansowanych aplikacji opartych na AI. Wśród zapowiedzi znalazły się m.in.:
Azure OpenAI Service – usługa, która pozwala w prosty i bezpieczny sposób korzystać z najnowszych i najpotężniejszych modeli językowych stworzonych przez OpenAI takich jak GPT-4 Turbo i DALL·E 3. Azure OpenAI Service oferuje również możliwość dostosowywania modeli do własnych danych i potrzeb, a także korzystania z modeli innych dostawców, takich jak Meta, Mistral, G42 czy Cohere.
Azure AI Studio – jedno miejsce ze wszystkimi narzędziami potrzebnymi do inteligentnych aplikacji. Umożliwia ono łatwe łączenie danych z różnych źródeł, wybieranie odpowiedniego modelu z katalogu, tworzenie i testowanie instrukcji dla modelu, monitorowanie i ocenianie wyników, a także wdrażanie aplikacji.
Azure AI Content Safety – system bezpieczeństwa zaprojektowany do wykrywania i blokowania na bieżąco problematycznych treści zarówno w promptach, jak i odpowiedziach. Dodatkowo pomaga on radzić sobie z nowymi zagrożeniami specyficznymi dla aplikacji opartych na dużych modelach językowych, takimi jak jailbreaki (atakami polegającymi na obejściu wbudowanych zabezpieczeń poprzez specjalnie skonstruowane prompty) czy ataki wstrzyknięć promptów polegające na dodaniu do poleceń wrogich instrukcji.
Copilot – inteligentny asystent, który pomaga uzyskać dostęp do całej wiedzy zgromadzonej w systemach komputerowych organizacji. Łączy on zaawansowane modele językowe z danymi pochodzącymi z Azure Resource Graph oraz z firmowych i ogólnie dostępnych źródeł danych.
> MICROSOFT COPILOT
Microsoft Copilot wykorzystuje zaawansowane modele generatywnej sztucznej inteligencji opracowane przez organizację OpenAI – do generowania tekstu model GPT-4, a do grafiki DALL·E 3. Oprócz tego podaje także źródła, na podstawie których wygenerował odpowiedzi. Ponieważ Copilot ma dostęp do internetu, zwraca aktualne odpowiedzi – dzięki zastosowaniu opisanego w dalszej części artykułu mechanizmu RAG (ang. Retrieval-Augmented Generation) potrzebne do udzielenia odpowiedzi dane są wyszukiwane i automatycznie dołączane do promptów użytkownika. W dodatku Microsoft Copilot nie zapisuje ani promptów, ani odpowiedzi, nie używa ich do trenowania kolejnych wersji modeli, a nasze dane przesyłane są przez internet w postaci zaszyfrowanej i nikt, również firma Microsoft, nie ma do nich dostępu.
Lista możliwych zastosowań Copilota jest długa i obejmuje m.in.:
- szybkie podsumowywanie długich dokumentów PDF i artykułów,
- bezproblemowe tworzenie profesjonalnych i gotowych do publikacji treści dla klientów;
- tworzenie oszałamiających obrazów na potrzeby mediów społecznościowych, artykułów czy prezentacji;
- inteligentne odpowiadanie na zadane pytania na podstawie ogólnodostępnych lub prywatnych danych;
- analizę danych;
- prezentowanie wyników w wybranych formatach, w tym jako tabel czy dokumentów JSON;
- tłumaczenie tekstów w różnych językach.
Podobne możliwości oferuje wiele usług. Pamiętaj jednak, że korzystanie z niezatwierdzonych usług internetowych AI może skutkować udostępnieniem Twoich danych firmom trzecim – przed skorzystaniem z takich usług zawsze zapoznaj się z licencją końcowego użytkownika, zwracając szczególną uwagę na to, kto i w jakim celu może korzystać z Twoich danych.
Microsoft Copilot dostępny jest:
- pod adresem copilot.microsoft.com;
- w wyszukiwarce Bing (bing.com) po wybraniu opcji Chat;
- na pasku bocznym przeglądarki Edge;
- w najnowszych wersjach systemu Windows.
- poprzez aplikację mobilną Microsoft Copilot (w czasie powstawania artykułu była ona dostępna wyłącznie na systemy Android).
W każdym wypadku skorzystanie z usługi wymaga zalogowania się na konto Microsoftu. Usługa jest kompatybilna z przeglądarkami Google Chrome i Microsoft Edge, ale zakres oferowanych funkcjonalności zależy od używanej przeglądarki.
Pod adresem aka.ms/Copilot/try dostępna jest interaktywna symulacja pozwalająca zapoznać się z najważniejszymi możliwościami Copilota. Po zalogowaniu się na firmowe konto Microsoft zobaczymy zielone ikony tarczy informujące nas, że zarówno wprowadzane dane (prompty), jak i generowane odpowiedzi są chronione.
> POZNAJEMY MICROSOFT COPILOT
Po zalogowaniu się na stronie copilot.microsoft.com na firmowe konto Microsoftu zobaczymy główne okno usługi.
Jeżeli nie wiesz, o co zapytać Copilota, wypróbuj lub zmodyfikuj jeden z przykładowych promptów. Aby uzyskać najbardziej wszechstronne odpowiedzi, wybierz styl kreatywny. Dla szybszych, bardziej konkretnych odpowiedzi wypróbuj style zrównoważony lub precyzyjny.
Pamiętaj, że zamiast wpisywać prompty, możesz kliknąć ikonę mikrofonu i je podyktować. Liczba znaków pojedynczego prompta jest ograniczona, w tym wypadku do 2 tys. – informację o liczbie pozostałych znaków znajdziesz tuż obok przycisku wysłania prompta, który możemy przekazać również klawiszem Enter.
Znajdujący się po prawej stronie okienka promptu przycisk pozwala wysłać do usługi obraz – odnośnik do grafiki dostępnej online, plik graficzny zapisany na komputerze lub zdjęcie zrobione aparatem. Po dołączeniu obrazu nie zapomnij o nie zapytać (możesz np. poprosić o podsumowanie widocznych na nim informacji albo o zlokalizowanie danego obiektu czy miejsca) albo wydać dotyczącego tego obrazu polecenia (np. poprosić o wygenerowanie podobnych, ale zawierających dodatkowe obiekty obrazów lub o wygenerowanie obrazów w innym stylu, np. stylu Pabla Picassa).
Widoczny z lewej strony przycisk nowego tematu spowoduje zakończenie (baz zapisywania) bieżącej rozmowy i rozpoczęcie nowej. Copilot pamięta bieżącą rozmowę, więc można się odwołać do poprzednich promptów lub odpowiedzi. Można np. poprosić o zmianę wygenerowanych obrazów, pisząc „Can you change the style to Van Gogh?”. Microsoft Copilot zna wiele języków, w tym polski. O ile jednak dobrze radzi sobie z tłumaczeniem na różne języki, o tyle najlepsze rezultaty można osiągnąć w języku angielskim.
Liczba odpowiedzi w ramach rozmowy jest ograniczona, np. do 30. Każdą z nich można ocenić (podniesionym lub skierowanym w dół kciukiem), skopiować do schowka lub wyeksportować do pliku tekstowego, dokumentu PDF lub Worda. Jeżeli do wygenerowania odpowiedzi użyte zostały jakieś źródła danych, zostaną one zacytowane.
Aby zagwarantować prywatność danych, Copilot nie zapisuje historii rozmów. Rozmowa zostanie utracona po:
- kliknięciu przycisku Nowy temat;
- zamknięciu okna przeglądarki;
- pozostawieniu czatu bezczynnego przez kilka godzin.
Copilot również zapomni o wszystkich plikach PDF lub stronach internetowych, które otwarto w przeglądarce Edge. Należy zapisać zawartość czatu, jeśli będzie ona potrzebna w przyszłości.
Pod adresem aka.ms/ai900-bing-copilot znajduje się opis krótkiego ćwiczenia, którego wykonanie pozwoli zapoznać się z Microsoft Copilot.
[…]
Marcin Szeliga
Pracownik naukowy Uniwersytetu WSB Merito w Chorzowie, jest autorem książek poświęconych analizie danych i posiada tytuł Microsoft Most Valuable Professional.