Große Sprachmodelle für Ihre Daten

„Talk to your data“ – Entdecken Sie das Potenzial von großen Sprachmodellen wie ChatGPT, um mit Ihren Datenquellen zu chatten!

Jetzt Kontakt aufnehmen

Wie Sprachmodelle Ihrem Unternehmen helfen können

Große Sprachmodelle wie ChatGPT (Large Language Models, LLM) haben die Welt erobert, wie kaum eine andere Technologie. Sie sind nicht nur ein kurzer Tech-Hype, sondern ein Paradigmen-Wechsel unserer Interaktion mit Daten, Wissen und Entscheidungsfindung. Das Potenzial dieser neuen Technologie zeigt sich über alle Wirtschaftsbereiche hinweg:

Persönlicher Assistent

Verabschieden Sie sich von Informationsüberflutung und heißen Sie handlungsrelevante Erkenntnisse willkommen. Persönliche Sprach-Assistenten können riesige Mengen an Text, Dokumenten und unstrukturierten Daten in Sekundenbruchteilen analysieren und ihnen die gesuchten Informationen aus öffentlichen und privaten Quellen heraussuchen, sowie individuell den Wünschen entsprechend aufbereiten.

Beispiel: QA-Chatbot

Hochschulbildung

Universitätsvorlesungen sind schon lange keine reinen Hörsaal-Veranstaltungen mehr. Doch mit Hilfe von Sprachmodellen wird die Lehre interaktiver und individueller. Studierende können nun direkt aus der Lernplattform (z.B. Moodle) mit einem Chat-Bot interagieren, der Fragen zu den jeweiligen Lerninhalte unter Nennung von Quellen beantwortet, Kapitel zusammenfasst oder Test-Fragen für die Klausurvorbereitung erstellt.

Beispiel: GPT in der Lehre an der RWTH Aachen

E-Commerce

Die Otto-Gruppe betreibt zahlreiche Online-Shops, deren Sortimente und Kataloge sich zum Teil stark unterscheiden. Kodiert man die Produktbeschreibung aber geschickt mit den Werkzeugen aus dem LLM-Bereich, lassen sich die Produkte der jeweiligen Shops ineinander übersetzen. Hierdurch können kundenspezifische Produktempfehlungen Shop-übergreifend generiert werden.

Beispiel: Produkt-Übersetzung im E-Commerce

Energiewirtschaft

Die Menge der in Textform verfügbaren Informationen ist enorm. Für Energieversorgungsunternehmen sind dies etwa Anlagen- und Fehlerprotokolle, Berichte zu Markt- und Preisentwicklungen, Umweltauflagen, CO2-Bilanzen sowie Kundenprofile und -verträge. Durch den Einsatz großer Sprachmodelle können diese Informationen in fast allen Schritten der Wertschöpfungskette integriert und genutzt werden.

Beispiel: KI-basierte Textanalyse für die Energiewirtschaft

Inspiriert von den innovativen Möglichkeiten der Digitalisierung mit KI?

Haben Sie schon einen konkreten Use Case für Ihr Unternehmen ausgemacht, den Sie gerne mit uns umsetzen möchten? Oder ist es noch eine vage Idee, die wir gemeinsam erhärten wollen?

Egal wo Sie gerade stehen, ein Einstieg in die Nutzung großer Sprachmodelle auch in Ihrem Unternehmen ist nicht schwer. Wir nehmen Sie gerne mit auf die gemeinsame Reise, um auch für Sie die individuellen Vorteile von KI zu entfalten.

Jetzt den nächsten Schritt gehen

Sprachmodelle verschieben die Grenzen des Möglichen

Große Sprachmodelle ermöglichen nicht nur Use-Cases, die vorher nicht wirtschaftlich realisierbar waren, sondern verändern auch Anforderungen an Daten und Vorgehensweisen. Zu Beginn stellen uns Kunden häufig ähnliche Fragen:

Wie viele Daten werden benötigt um große Sprachmodelle einsetzen zu können?

Während traditionelle NLP-Modelle früher nur gut funktionierten, wenn sie auf eigenen Daten trainiert wurden, können große Sprachmodelle heute auch mit ungesehenen Daten umgehen. Entsprechend werden keine großen Datenmengen für ein Modelltraining benötigt, sondern nur genau die Daten, mit denen sie arbeiten wollen. Das können viele Tausende sein oder nur eine Handvoll.

Müssen Daten gelabelt werden?

Da große Sprachmodelle nicht unbedingt weiter trainiert werden müssen, sind auch keine gelabelten Trainingsdaten notwendig. Dennoch muss die Qualität der Antworten evaluiert werden um Verbesserungspotentiale identifizieren zu können. Entsprechend sollten während der Entwicklung Domänenexperten mit unserem Team zusammenarbeiten, um eine qualitative Evaluation zu ermöglichen.

Besteht die Gefahr, dass ChatGPT aus unseren Daten lernt, wenn ich es nutze?

Nein! Auch bei großen Sprachmodellen sind Training und Inference zwei separate Prozesse. Um aus Anfragen von Nutzern zu lernen, müssen diese zunächst gesammelt und dann dem Trainingsprozess zugeführt werden. Während OpenAI dies bei der Nutzung des Playgrounds zu Beginn tat, besteht bei der Nutzung von Sprachmodellen über API (z. B. über Azure OpenAI Services) die Garantie, dass Ihre Daten keinesfalls für Trainingszwecke genutzt werden.

Wie unterscheidet sich die Nutzung eines LLMs mit unseren Firmendaten vom OpenAI Playground?

ChatGPT wurde auf zahlreichen, im Internet verfügbaren Daten trainiert. Entsprechend kann das Modell nur Wissen wiedergeben, das es hierbei aufgenommen hat. Durch die Integration Ihrer eigenen Firmendaten bekommt das Modell für den Zeitraum der Nutzung Einsicht in Ihre internen Informationen und kann Aufgaben basierend auf diesen Informationen erledigen.

Unsere gemeinsame Roadmap

Sie wollen das Potenzial von großen Sprachmodellen für Ihr Unternehmen nutzen? Wir unterstützen Sie von der Generierung neuer Ideen bis zur produktiven Umsetzung.

Jetzt gemeinsam starten

Dream
Vision ableiten

Gemeinsame Identifikation von Anwendungsfällen und Zielen für den Einsatz in Ihrem Unternehmen. Unsere Experten beraten damit Sie, damit Sie die Potentiale und Herausforderungen besser einordnen können.
Derive
Rahmenbedingungen schaffen

Exploration der vorhandenen Datenquellen zwecks erweitertem Verständnis und Einschätzung der Machbarkeit.
Verprobung kritischer Kompotenten, bspw. Auswahl eines geeigeneten Sprachmodells.
Develop
Produkt entwickeln

Entwicklung in enger Absprache mit Stakeholdern um nahtlose Integration zu gewährleisten.
Verprobung der Ergebnisqualität unter Beachtung von Datenschutzrichtlinien und Sicherheitsstandards.
Deploy
Überwachte Einführung

Integration der Sprachmodelle in die bestehende Infrastruktur und Prozesse. Etablierung einer kontinuierlichen Modell-Überwachung sowie fortlaufende Unterstützung z.B. durch Schulungen.

Das sagen unsere Kunden

„In unserem Projekt konnten die Kollegen von scieneers nicht nur fachlich sondern auch menschlich überzeugen: Gepaart mit hoher Motivation und einer Prise Spaß führt das immer wieder zu hervorragenden Ergebnissen. Danke dafür!“

Benjamin ReinhardProduktentwicklung bei Steag New Energies GmbH

„Dank scieneers konnten in kurzer Zeit die Laufzeiten der ETL-Ladeprozesse einer großen Applikation auf AWS von ursprünglich mehreren Tagen auf wenige Stunden verkürzt und damit auch die Betriebskosten signifikant gesenkt werden. Markus hat sich als AWS/Glue Spark Data Engineer sehr schnell in unser internes Team integriert und hier wesentlich zum Erfolg beigetragen. Vielen Dank für die sehr gute Partnerschaft.“

Andreas HeuerSenior Director IT Portfolio Management bei CENTOGENE GmbH

„Mit scieneers haben wir einen höchst kompetenten und verlässlichen Partner, mit dem wir unsere Plattform zur Datenanalyse aufgebaut haben. Auch steht uns das engagierte Team von scieneers mit Rat und Tat zur Seite, wenn es um weiterführende Biostatistik geht: Damit können wir neue und wertvolle Erkenntnisse zu unserer Technologie der biologischen Methanisierung gewinnen.“

Dipl. Ing. Birgit Lewandowski Director Development bei Electrochaea GmbH

„Die Kollegen unseres Partners scieneers verfügen über ein ausgezeichnetes Fachwissen und kommen sehr rasch zu Lösungen, die uns helfen, unsere BI-Systeme stabil und performant weiter zu entwickeln.“

Jan DosterLeiter BI, PMO & IT Service bei SuperBioMarkt AG

“You are the most efficient meet’ers I’ve ever met…”

Dr. Laurent LardonSenior Process Engineer bei Electrochaea GmbH

“The scieneers Power BI Advanced training was well organized and objective, including interactive discussions in which any questions have been adressed by the trainers in a very professional way. I would 100% do it again!”

Amr AshourSHARP BUSINESS SYSTEMS DEUTSCHLAND GMBH

„Ich bin beeindruckt, wie sich die scieneers-Kollegen in kürzester Zeit in die Problemstellungen eingearbeitet und mit kreativen Lösungsansätzen dazu beigetragen haben, dass wir unsere Analyseergebnisse deutlich verbessern konnten.“

Michael ScholzEnBW

“Mit den scieneers haben wir einen Partner gefunden, der unsere Vision versteht und in der Lage ist, sie schnell und effizient in funktionierende Lösungen umzusetzen.”

Dr. Christoph TempichDirector Digital bei von Rundstedt

“In dem scieneers Power BI Training sind unsere Kollegen sehr gut mitgekommen und konnten viel Neues mitnehmen. Es war ein voller Erfolg!”

Emilia BarberioBusiness Intelligence Project Manager bei Kendrion GmbH

“Mit den scieneers haben wir trotz schwieriger Rahmenbedingungen schnell und pragmatisch eine sehr gute Lösung umgesetzt. Nicht nur fachlich, sondern auch menschlich zeigen die scieneers sehr viel Flexibilität und Kundenorientierung!”

Ali SalmanManager Global Reporting bei Daimler Truck AG

“Das Fachwissen der scieneers, das klare Kundenengagement und die Bereitschaft Lösungen zu verbessern um die größtmögliche Wertschöpfung für Kunden zu erzielen, ist beeindruckend. Die Zusammenarbeit mit den scieneers war reibungslos, schnell, vertrauensvoll und offen. Das Testen neuer Ideen und die Anwendung optimierter Lösungen war nur eine Frage von wenigen Stunden.”

Sven WeisseAccount Executive Industry Partner bei Intel Corporation

“Agile Entwicklung von Analytics Projekten erfordert stets hohes Vertrauen bei allen Beteiligten. Hier haben wir mit scieneers einen sehr engagierten Partner gefunden, der in der Lage ist mit seiner Expertise sowie der offenen und pragmatischen Art stets gute kundenorientierte Lösungen herzustellen.”

Sascha BackProduct Owner Prosoz Analytics

“Durch die vertrauensvolle Zusammenarbeit zwischen dem Jobcenter Ostalbkreis und dem Team von scieneers, konnten die Anforderungen der politischen Ebenen stets realisiert werden. Im weiteren Projekt werden wir gemeinsam an der produktiven Weiterentwicklung arbeiten!”

Philipp PriemerLeiter Controlling Landratsamt Ostalbkreis

“Mithilfe des von den scieneers entwickelten MIP-Power BI Connectors konnten wir deutlich schneller erste Reports und Dashboards für unsere Shopfloors generieren. Besonders gut gefallen hat uns die schnelle und unkomplizierte Zusammenarbeit!”

Thomas von LonskiData Analytics Platform Manager bei Schott AG

“Kompetent, motiviert, flexibel, menschlich – mit diesen Attributen würde ich die scieneers und die Zusammenarbeit mit ihnen beschreiben. Ich freue mich jetzt schon auf das nächste Projekt, das wir mit den Kolleg:innen umsetzen werden.”

Dr. Christoph StockhusenHead of Data Platform - Otto Group data.works GmbH

“scieneers haben schnell unsere Anforderungen verstanden und gemeinsam konnten wir die gewünschten Lösungen effizient umsetzen und live schalten. Das Projekt mit euch hat Spaß gemacht und war erfolgreich!”

Rüdiger LangPrincipal - Consileon Business Consultancy GmbH

“Die Zusammenarbeit mit scieneers bei der Einführung unserer Power BI Plattform hat sich von Anfang an als die richtige Entscheidung erwiesen. Vom Projekt-Kickoff, über die erste Implementierung bis hin zum agilen Ausbau der Datasets und Reportings verläuft die Zusammenarbeit äußerst effizient und wir finden sowohl technisch, als auch kaufmännisch für unser Business die stets passenden Lösungen. Ich kann scieneers hinsichtlich Know-how und methodischem Vorgehen uneingeschränkt weiterempfehlen”

Sebastian TuttasProjektmanager - doxx GmbH

Dürfen wir auch Sie unterstützen? – Kontaktieren Sie uns!

Gern berät Sie unser Director of Data Science
Dr. Lars Perchalla
in einem unverbindlichen Erstgespräch.

Ihre Anfrage

Weitere Blog-Posts zum Thema Large Language Models

Reale Use Cases aus unseren bisherigen projekten zum Einsatz von großen Sprachmodellen

Wie Studierende von LLMs und Chatbots profitieren können

8. November 2024

In der Hochschulbildung revolutionieren Large Language Models (LLMs) und Retrieval Augmented Generation (RAG) das Lernen. Ein Projekt der Universität Leipzig zeigt den Erfolg von KI-Tutoren im Jura-Studium, die personalisierte Antworten bieten und auf Ressourcen verweisen. Vorteile für Studierende und Lehrende sind maßgeschneiderte Unterstützung und effiziente Lehrmaterialentwicklung, trotz Herausforderungen wie Ressourcenbedarf und Antwortqualität. Azure und OpenAI unterstützen mit sicherer Infrastruktur.

KI für das Gemeinwohl auf dem Digital-Gipfel 2024

31. Oktober 2024

Wir durften unser durch den Civic Coding-Accelerator gefördertes LLM-Projekt StaatKlar an Tag 2 des Digital-Gipfels 2024 vorstellen. Für alle Neugierigen hier eine kurze Zusammenfassung unseres Projekts und des Gipfels.

Der Einsatz von VideoRAG für den Wissenstransfer im Unternehmen

23. Oktober 2024

VideoRAG bietet einen innovativen Ansatz zur Überbrückung von Wissenslücken in Unternehmen, indem Video- und Textdaten mit Hilfe von generativer KI und Retrieval-Augmentation in eine durchsuchbare Wissensdatenbank umgewandelt werden. Es gewährleistet einen effizienten Transfer von nuanciertem Wissen, einschließlich des impliziten Wissens erfahrener Mitarbeiter, über KI-basierte Chatbots und macht es so auch jüngeren Generationen innerhalb der Belegschaft zugänglich.

NextGeneration:AI – Innovation trifft Datenschutz

23. April 2024

Zusammen mit der Carl Remigius Fresenius Education Group (CRFE) entwickelten wir NextGeneration:AI. Dabei handelt es sich um eine datenschutzkonforme Plattform zur Nutzung von Sprachmodellen für alle Studierende und Mitarbeitende der CRFE. Das besondere an NextGeneration:AI ist die Authentifizierung über das Learning Management System Ilias mit Hilfe einer LTI-Schnittstelle, sowie die umfassende Personalisierbarkeit, die Nutzer:innen geboten wird. Im Blogartikel gehen wir auf die Details der Implementierung ein.

Multi-Agenten-LLM-Systeme kontrollieren mit LangGraph

28. März 2024

Im zweiten Teil der Reihe zu Multi-Agenten-Systemen werfen wir einen Blick auf LangGraph auf dem LangChain Ökosystem. LangGraph ermöglicht eine dynamische Kommunikation der Agenten die Mittels eines Graphen modelliert wird. Der Artikel vergleicht außerdem LangGraph mit AutoGen mit Blick auf Projektstatus, Nachrichtenfluss, Usability und Produktreife.

Erforschung des Dark Genome mit Machine Learning zur Entwicklung neuartiger Krankheitsinterventionen

29. Februar 2024

350 Millionen, fast 5% der Weltbevölkerung leben mit einer seltenen Erkrankung. Etwa 75% der seltenen Erkrankungen betreffen Kinder. 80% dieser Erkrankungen entstehen durch eine einzige genetische Veränderung und können durch eine Genomanalyse diagnostiziert werden. Das menschliche Genom besteht aus etwa 3.3 Milliarden Bausteinen und jeder Mensch trägt etwa 3.5 Millionen Varianten. Die Suche nach der einen, pathogenen Variante, als Ursache der Krankheit, gleicht der Suche nach der Nadel im Heuhaufen.

Personalisierte Stellenausschreibungen durch LLMs auf Grundlage einer Personenbeschreibung

5. Februar 2024

In unserem Blogartikel zur Individualisierung von Konferenz-Programmen durch LLMs zeigen wir bereits einen Anwendungsfall von Textpersonalisierung durch den Einsatz von LLMs. Neben dem Individualisieren von Konferenz-Programmen anhand gegebener Interessen und Kenntnisse existieren weitere Anwendungsfälle im Bereich der personalisierten Generierung von Text. Daher haben wir die Personalisierung von Stellenausschreibungen durch LLMs anhand einer kurzen Personenbeschreibung getestet.

User sitting in front of a pc with privacy shield

rwthGPT – Eine datenschutzkonforme Plattform für OpenAI-Modelle

2. Dezember 2023

Zusammen mit der RWTH Aachen University haben wir rwthGPT entwickelt: Eine datenschutzkonforme Plattform zur Nutzung von OpenAI-Modellen für Studierende und Mitarbeitende. Ergänzt wird rwthGPT durch ein dediziertes User-Management mit Kostenzuordnung, das Speichern von Chat-Verläufen und Talk to your Data. Wir werfen einen detaillierten Blick auf die Datenschutz-relevanten Aspekte.

House containing multiple shops connected by an information line

LLMs und Cloud-Technologien zur Vernetzung von Onlineshops der Otto-Gruppe

16. September 2023

Large Language Models (LLMs) sind wegen ihrer vielfältigen Anwendungen in aller Munde. Auch im E-Commerce Bereich ist diese Technologie sehr nützlich. Zusammen mit der data.works GmbH haben wir sogenannte Embedding-Modelle aus dem LLM-Bereich mit der Vertex AI Matching Engine in der Google Cloud für mehrere Onlineshops der Otto-Gruppe eingesetzt, um kundenspezifische Produktempfehlungen aus einem Shop auf viele andere Shops übertragen zu können. Und das, obwohl sich die Sortimente und Kataloge dieser Shops stark unterscheiden.