Gorące tematy

Gospodarka

Ceny w USA rosną wolniej, ale ryzyko recesji coraz większe

Inflacja CPI w USA w marcu wyniosła 2,4 proc....
00:03:26

Cła nie uzdrawiają gospodarki. Trump ignoruje ekonomię i lekcje historii

Według aktualnej wiedzy ekonomicznej działania prezydenta Trumpa, takie jak...

Trump rozdaje karty na nowo: czasowe zawieszenie ceł, uderzenie w Chiny

Prezydent Stanów Zjednoczonych Donald Trump ogłosił tymczasowe zawieszenie ceł...

Wojna handlowa z Chinami rozkręca się na dobre. Ameryka na kursie kolizyjnym?

Niełatwo opisywać rzeczywistość w czasach, w których na rynku...

Donald Trump podnosi cła. Polska branża eksportowa pod presją, ale nastroje stabilne

Decyzja prezydenta Stanów Zjednoczonych Donalda Trumpa wprowadzająca szeroko zakrojone...

Marketing

PR korporacyjny w erze AI i mediów cyfrowych. Ewolucja, nie zmierzch

Rozwój technologiczny, w tym coraz szersze zastosowanie AI, rosnąca...

Jak sztuczna inteligencja rewolucjonizuje marketing sensoryczny i zmienia doświadczenia zakupowe

Sztuczna inteligencja zmienia oblicze handlu detalicznego, wprowadzając nowy poziom...

Sektor PR w Polsce rośnie, ale się rozdrabnia. Dominują jednoosobowe działalności

Pandemia, inflacja oraz sztuczna inteligencja całkowicie zmieniły rynek agencji...

AI jest niezbędna, ale nie rozwiązuje wszystkiego. Marketerzy pod presją wyników i redukcji zatrudnienia

Ambitniejsze cele, mniejsze budżety: aż 73% marketerów, mimo korzystania...

Nowoczesny marketing B2B – jak skutecznie pozyskiwać klientów i zwiększać sprzedaż?

Firmy działające w sektorze B2B potrzebują skutecznych i dobrze...

Polityka

Kampania prezydencka – fake newsy i emocje znów dominują kampanię

Rafał Trzaskowski z największą widocznością w mediach, Sławomir Mentzen...
00:03:26

Cła nie uzdrawiają gospodarki. Trump ignoruje ekonomię i lekcje historii

Według aktualnej wiedzy ekonomicznej działania prezydenta Trumpa, takie jak...

Trump rozdaje karty na nowo: czasowe zawieszenie ceł, uderzenie w Chiny

Prezydent Stanów Zjednoczonych Donald Trump ogłosił tymczasowe zawieszenie ceł...

Wojna handlowa z Chinami rozkręca się na dobre. Ameryka na kursie kolizyjnym?

Niełatwo opisywać rzeczywistość w czasach, w których na rynku...

Ewa Wrzosek i medialna burza, której skala zaskakuje

Sprawa Ewy Wrzosek rozgrzała polską debatę publiczną do czerwoności....

Prawo

AI w prawie – technologia, która usprawnia, ale nie zastępuje człowieka

Wraz z dynamicznym rozwojem technologii sztucznej inteligencji (AI), coraz...

Raport PSF: Fotowoltaika w Polsce potrzebuje pilnych zmian prawnych

Polska fotowoltaika stoi na rozdrożu. Mimo dynamicznego wzrostu, sektor...

Inicjatywa SprawdzaMY – ósma tura pomysłów wybrana do analiz przez Zespoły Eksperckie

Ósma tura zgłoszonych rozwiązań obejmuje 25 propozycji, z których...
00:01:08

Nowe regulacje pracy platformowej: UE wprowadza domniemanie stosunku pracy

Rok 2025 przynosi znaczące zmiany w polskim prawie pracy,...

Agnieszka Majewska chwali rządowy projekt deregulacyjny i apeluje o szybsze wdrożenie zmian w Małym ZUS Plus

W związku z rozpoczęciem przez Sejm Rzeczypospolitej Polskiej prac...
Autor/źródło

Gorące tematy

Gospodarka

Ceny w USA rosną wolniej, ale ryzyko recesji coraz większe

Inflacja CPI w USA w marcu wyniosła 2,4 proc....
00:03:26

Cła nie uzdrawiają gospodarki. Trump ignoruje ekonomię i lekcje historii

Według aktualnej wiedzy ekonomicznej działania prezydenta Trumpa, takie jak...

Trump rozdaje karty na nowo: czasowe zawieszenie ceł, uderzenie w Chiny

Prezydent Stanów Zjednoczonych Donald Trump ogłosił tymczasowe zawieszenie ceł...

Wojna handlowa z Chinami rozkręca się na dobre. Ameryka na kursie kolizyjnym?

Niełatwo opisywać rzeczywistość w czasach, w których na rynku...

Donald Trump podnosi cła. Polska branża eksportowa pod presją, ale nastroje stabilne

Decyzja prezydenta Stanów Zjednoczonych Donalda Trumpa wprowadzająca szeroko zakrojone...

Marketing

PR korporacyjny w erze AI i mediów cyfrowych. Ewolucja, nie zmierzch

Rozwój technologiczny, w tym coraz szersze zastosowanie AI, rosnąca...

Jak sztuczna inteligencja rewolucjonizuje marketing sensoryczny i zmienia doświadczenia zakupowe

Sztuczna inteligencja zmienia oblicze handlu detalicznego, wprowadzając nowy poziom...

Sektor PR w Polsce rośnie, ale się rozdrabnia. Dominują jednoosobowe działalności

Pandemia, inflacja oraz sztuczna inteligencja całkowicie zmieniły rynek agencji...

AI jest niezbędna, ale nie rozwiązuje wszystkiego. Marketerzy pod presją wyników i redukcji zatrudnienia

Ambitniejsze cele, mniejsze budżety: aż 73% marketerów, mimo korzystania...

Nowoczesny marketing B2B – jak skutecznie pozyskiwać klientów i zwiększać sprzedaż?

Firmy działające w sektorze B2B potrzebują skutecznych i dobrze...

Polityka

Kampania prezydencka – fake newsy i emocje znów dominują kampanię

Rafał Trzaskowski z największą widocznością w mediach, Sławomir Mentzen...
00:03:26

Cła nie uzdrawiają gospodarki. Trump ignoruje ekonomię i lekcje historii

Według aktualnej wiedzy ekonomicznej działania prezydenta Trumpa, takie jak...

Trump rozdaje karty na nowo: czasowe zawieszenie ceł, uderzenie w Chiny

Prezydent Stanów Zjednoczonych Donald Trump ogłosił tymczasowe zawieszenie ceł...

Wojna handlowa z Chinami rozkręca się na dobre. Ameryka na kursie kolizyjnym?

Niełatwo opisywać rzeczywistość w czasach, w których na rynku...

Ewa Wrzosek i medialna burza, której skala zaskakuje

Sprawa Ewy Wrzosek rozgrzała polską debatę publiczną do czerwoności....

Prawo

AI w prawie – technologia, która usprawnia, ale nie zastępuje człowieka

Wraz z dynamicznym rozwojem technologii sztucznej inteligencji (AI), coraz...

Raport PSF: Fotowoltaika w Polsce potrzebuje pilnych zmian prawnych

Polska fotowoltaika stoi na rozdrożu. Mimo dynamicznego wzrostu, sektor...

Inicjatywa SprawdzaMY – ósma tura pomysłów wybrana do analiz przez Zespoły Eksperckie

Ósma tura zgłoszonych rozwiązań obejmuje 25 propozycji, z których...
00:01:08

Nowe regulacje pracy platformowej: UE wprowadza domniemanie stosunku pracy

Rok 2025 przynosi znaczące zmiany w polskim prawie pracy,...

Agnieszka Majewska chwali rządowy projekt deregulacyjny i apeluje o szybsze wdrożenie zmian w Małym ZUS Plus

W związku z rozpoczęciem przez Sejm Rzeczypospolitej Polskiej prac...
Autor/źródło
Autor/źródło
wtorek, 15 kwietnia, 2025

Jaki model AI wybrać? Jest już specjalny benchmark, który pokazuje ich wady i zalety

Biuro Tłumaczeń OnlineBiuro Tłumaczeń Online

Salesforce wprowadził pierwszy na świecie benchmark LLM, który ma pomóc firmom w ocenie szybko rosnącej liczby dużych modeli językowych (LLM) do wykorzystania w ich systemach zarządzania relacjami z klientami (CRM).

Nowy benchmark to kompleksowe ramy oceny, które mierzą wydajność LLM w odniesieniu do czterech kluczowych miar: dokładności, kosztów, szybkości oraz zaufania i bezpieczeństwa. Został on zaprojektowany do oceny typowych przypadków użycia w sprzedaży i usługach, w tym prospectingu, lead nurturingu, a także podsumowań szans sprzedaży i przypadków usług. Benchmark udostępnia użytkownikom tabelę liderów, aby pomóc profesjonalistom zdecydować, który LLM  najlepiej sprawdzi się w przypadku ich indywidualnych potrzeb. Salesforce będzie nadal włączać nowe scenariusze przypadków użycia do benchmarku i ulepszać ocenę LLM.

Dlaczego jest to ważne?

Istniejące benchmarki LLM są ograniczone do przypadków zastosowań akademickich i konsumenckich, a ich znaczenie dla biznesu jest bardzo niewielkie. Brakuje w nich również odpowiednich ocen ekspertów i nie uwzględniają one dokładności, szybkości, kosztów i kwestii zaufania. Te niedociągnięcia sprawiły, że firmy nie mają wiarygodnej metody oceny skuteczności generatywnych rozwiązań CRM opartych na sztucznej inteligencji. Bez wyraźnego poczucia, jak LLM sprawdzają się w tych metrykach dla konkretnych przypadków użycia, firmy muszą podejmować decyzje „po omacku”.

Opracowany przez Salesforce AI Research benchmark w wyjątkowy sposób wykorzystuje rzeczywiste dane CRM, a także eksperckie oceny dokonywane przez praktyków. Umożliwia to firmom wykorzystanie benchmarku do podejmowania bardziej strategicznych decyzji dotyczących sposobu włączenia generatywnej sztucznej inteligencji do ich systemów CRM.

Co mierzy benchmark?

Dokładność: Ta kategoria obejmuje cztery podkategorie: rzeczowość, kompletność, zwięzłość i zgodność z instrukcjami. Im dokładniejsze są przewidywania lub zalecenia, tym bardziej wartościowe będą wyniki dla zespołów w całej organizacji – a im bardziej wartościowe wyniki, tym lepsze działania mogą podjąć w celu poprawy obsługi klienta. Jeśli model jest wystarczająco dokładny dla danego przypadku użycia, ważne jest również, aby wziąć pod uwagę inne wskaźniki. Nawet jeśli model nie jest wystarczająco dokładny, techniki takie jak szybka inżynieria i dostrajanie mogą go poprawić.

Koszt: Metryka kosztów jest skategoryzowana jako wysoka, średnia i niska, w oparciu o percentyle. Jest to szacunkowy koszt operacyjny, który różni się w zależności od przypadku użycia. Klienci mogą ocenić opłacalność różnych rozwiązań LLM, aby upewnić się, że są one zgodne z ich budżetem i strategiami alokacji zasobów.

Szybkość: Ta metryka ocenia szybkość reakcji i wydajność LLM w przetwarzaniu oraz dostarczaniu informacji. Krótszy czas reakcji poprawia doświadczenie użytkownika, skracając czas oczekiwania klientów i umożliwiając zespołom sprzedaży oraz obsługi szybkie reagowanie na zapytania lub problemy.

Zaufanie i bezpieczeństwo: Ten wskaźnik mierzy zdolność LLM do ochrony wrażliwych danych klientów, przestrzegania przepisów dotyczących prywatności danych, zabezpieczania informacji oraz powstrzymywania się od stronniczości i toksyczności. Oceniając niezawodność LLM dla CRM, ten benchmark daje organizacjom poczucie przejrzystości w zakresie zaufania i bezpieczeństwa.

Dzięki platformie Einstein 1 firmy Salesforce, klienci mogą wybierać spośród istniejących rozwiązań LLM lub tworzyć własne modele spełniające ich unikalne potrzeby biznesowe. Wybierając modele dla swoich przypadków użycia CRM przy użyciu benchmarku, firmy mogą wdrażać bardziej skuteczne i wydajne rozwiązania generatywnej sztucznej inteligencji.

Organizacje biznesowe chcą wykorzystać sztuczną inteligencję do napędzania wzrostu, obniżania kosztów i dostarczania spersonalizowanych doświadczeń klientów, a nie do planowania przyjęcia urodzinowego dla dzieci czy streszczania lektur szkolnych. Nasi klienci prosili o specjalnie opracowany sposób oceny i wyboru spośród mnożących się nowych modeli sztucznej inteligencji. Cieszymy się, że możemy wprowadzić pierwszy na świecie benchmark LLM dedykowany CRM, aby pomóc im poruszać się po złożonym krajobrazie modeli. Ten benchmark to nie tylko miara; to kompleksowa, dynamicznie ewoluująca struktura, która umożliwia firmom podejmowanie świadomych decyzji, równoważąc dokładność, koszty, szybkość i zaufanie – powiedziała Clara Shih, dyrektor generalna Salesforce AI.

Autor/źródło
Disclaimer: Informacje zawarte w niniejszej publikacji służą wyłącznie do celów informacyjnych. Nie stanowią one porady finansowej lub jakiejkolwiek innej porady, mają charakter ogólny i nie są skierowane do konkretnego adresata. Przed skorzystaniem z informacji w jakichkolwiek celach należy zasięgnąć niezależnej porady.

Popularne w tym tygodniu

Polska ma potencjał, aby znaleźć się blisko czołówki państw najbardziej rozwiniętych technologicznie

Żyjemy w czasach największego rozwoju technologicznego, który niestety nie...

AI Accelerator: Nowy program Arrow Electronics dla firm chcących wykorzystać potencjał sztucznej inteligencji

AI Accelerator to nowy, ustrukturyzowany program pomagający partnerom handlowym...

AI w prawie – technologia, która usprawnia, ale nie zastępuje człowieka

Wraz z dynamicznym rozwojem technologii sztucznej inteligencji (AI), coraz...

Cyfrowa luka w administracji. AI ma być lekarstwem na brak efektywności

Tylko 32% dyrektorów firm i instytucji z sektora publicznego...

AI na usługach hakerów: rosnące zagrożenie dla firm i konsumentów

Według danych Proxyrack, globalne straty wynikające z cyberprzestępczości mogą...

Podobne tematy

Polacy wybierają wygodę kosztem bezpieczeństwa w sieci – wyniki Adyen Digital Report 2024

Pomimo rosnącej liczby cyberataków i oszustw 30 proc. konsumentów...

Automaty paczkowe kluczowym elementem strategii firm e-commerce

Według raportu „E-commerce w Polsce 2024”, opublikowanego przez Gemius,...

Marketing sensoryczny w metawersie: Czy wirtualne zakupy mogą angażować wszystkie zmysły?

Nowe technologie, takie jak wirtualna (VR) i rozszerzona rzeczywistość...

Pilotaż zakończony sukcesem – Poczta Polska rusza z modernizacją kolejnych placówek

W pierwszym kwartale 2025 roku Poczta Polska rozpoczyna proces...

Compensa wdraża AI, by zwiększyć efektywność o 75%

Compensa, jeden z liderów polskiego rynku ubezpieczeń majątkowych, wprowadza...

Michał Wrzesiński ponownie prezesem WeNet Group S.A.

Z dniem 3 lutego br. Michał Wrzesiński ponownie objął...

Automatyzacja w medycynie – jak nowoczesne systemy IT rewolucjonizują placówki zdrowotne?

Sektor ochrony zdrowia stawia na rozwój technologiczny, a automatyzacja...

Może Cię zainteresować

Polecane kategorie

Exit mobile version