Qgelm

StableLM: Stability AI veröffentlicht große KI-Sprachmodelle als Open Source

<html> <header class=„article-header“><h1 class=„articleheading“>StableLM: Stability AI veröffentlicht große KI-Sprachmodelle als Open Source</h1><div class=„publish-info“> Silke Hahn</div></header><figure class=„aufmacherbild“><img src=„https://heise.cloudimg.io/width/700/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/4/1/4/6/5/0/7/FuFhgiEaAAEIap5-085768a33eb7b7b1.jpeg“ srcset=„https://heise.cloudimg.io/width/700/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/4/1/4/6/5/0/7/FuFhgiEaAAEIap5-085768a33eb7b7b1.jpeg 700w, https://heise.cloudimg.io/width/1050/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/4/1/4/6/5/0/7/FuFhgiEaAAEIap5-085768a33eb7b7b1.jpeg 1050w, https://heise.cloudimg.io/width/1462/q75.png-lossy-75.webp-lossy-75.foil1/_www-heise-de_/imgs/18/4/1/4/6/5/0/7/FuFhgiEaAAEIap5-085768a33eb7b7b1.jpeg 1462w“ alt=„“ class=„img-responsive“ referrerpolicy=„no-referrer“ /><figcaption class=„akwa-caption“>„A Stochastic Parrot, flat design, vector art“ – Stable Diffusion.(Bild: <a href=„https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models“ target=„_blank“ rel=„external noopener“>Stability AI</a>)</figcaption></figure>Die Firma hinter Stable Diffusion hat zwei Sprachmodelle als Open Source veröffentlicht. Die LLMs stehen unter Copyleft-Lizenz, weitere Modelle sollen folgen.Stability AI hat mit StableLM zwei große Sprachmodelle als Open Source veröffentlicht: Die beiden Large Language Models (LLM) umfassen je 3 und 7 Milliarden Parameter. Bei dem Release handelt es sich um Alphaversionen. Entwickler können sie unter Beachtung der Lizenz für Forschungs- und kommerzielle Zwecke frei verwenden, untersuchen und adaptieren.StableLM-3B und StableLM-7B stehen unter der <a href=„https://creativecommons.org/licenses/by-sa/4.0/deed.de“ rel=„external noopener“ target=„_blank“>Lizenz CC BY-SA-4.0 [1]</a>: Das ist eine <a href=„https://www.heise.de/hintergrund/Chancen-und-Risiken-Copyleft-in-der-Softwareentwicklung-4926808.html“>Copyleft-Lizenz [2]</a>, die festlegt, dass die unter ihr stehende Software in jeder Format vervielfältigt und weiterverbreitet werden darf. Wer mit StableLM arbeitet, darf die Modelle verändern und weiterbearbeiten für beliebige Zwecke, auch kommerziell. Allerdings erben Ableger und Produkte stets die Copyleft-Lizenz.<h3 class=„subheading“ id=„nav_stablelm_steht0“>StableLM steht unter Copyleft-Lizenz</h3>Das bedeutet, dass von StableLM abgeleitete neue Modelle den ursprünglichen Urheber (Stability AI) und die Lizenz in unveränderter Form nennen und weitergeben müssen. So ist es untersagt, solcherart erstellte Software zu Closed Source zu machen, etwa zum eigenen geistigen Eigentum zu erklären oder an der geerbten Lizenz Änderungen vorzunehmen. Diese Vorgaben sind rechtlich durch keine zusätzlichen Klauseln oder technischen Verfahren auszuhebeln, die CC BY-SA-4.0 gilt als eine <a href=„https://www.heise.de/news/Copyleft-org-Was-Sie-schon-immer-ueber-die-GPL-wissen-wollten-2445300.html“>besonders starke Copyleft-Lizenz [3]</a>.Wie vom StabilityAI-CEO Emad Mostaque angekündigt soll StableLM eine offene, transparente und skalierbare Alternative zu proprietären KI-Modellen wie denen von OpenAI bieten. Modelle im Umfang von 15 bis 65 Milliarden Parametern sollen in absehbarer Zeit folgen, ist dem Blogpost zum Release zu entnehmen. Die Modelle der StableLM-Serie sollen Text und Quellcode erzeugen können und lassen sich laut Mostaque für zahlreiche darauf aufbauende Anwendungen nutzen. Mit den verhältnismäßig kleinen LLMs will Stability dem Blogeintrag zufolge zeigen, dass auch kleinere Modelle zu hoher Leistung fähig sind, sofern sie ein angemessenes Training durchlaufen haben und über eine effiziente Architektur verfügen.<h3 class=„subheading“ id=„nav_sind_modelle1“>Sind Modelle, die auf The Pile basieren, Open Source?</h3>Stability AI hatte zuvor die Arbeit der KI-Graswurzel EleutherAI unterstützt, die Anfang April 2023 mit Pythia eine Serie kleinerer KI-Basismodelle für die Forschung veröffentlicht hatten. Pythia-12B ist unter anderem das Ausgangsmodell für Dolly 2.0 von Databricks, und <a href=„https://www.heise.de/news/OpenAssistant-an-open-Alternative-to-ChatGPT-Conversational-AI-for-Everyone-8971294.html“>OpenAssistant von LAION fußt auf den quelloffenen Pythia-Modellen [4]</a>. Auch Erfahrungen mit früheren Open-Source-Modellen wie GPT-J und GPT-NeoX von EleutherAI hätten zum jetzigen Release von StableLM beigetragen.StableLM wurde auf einem neuen experimentellen Datensatz trainiert, der auf dem bekannten, <a href=„https://arxiv.org/abs/2101.00027“ rel=„external noopener“ target=„_blank“>800 Gigabyte großen Datensatz „The Pile“ [5]</a> für das Modellieren großer Sprachmodelle aufbaut, allerdings mit insgesamt 1,5 Billionen Token an Inhalt etwa dreimal so umfangreich ist wie dieser. Der Datensatz gilt als problematisch, da in ihm <a href=„https://twitter.com/sepia_fw/status/1648721507919491073“ rel=„external noopener“ target=„_blank“>wohl auch urheberrechtlich geschützte Werke enthalten [6]</a> sind (welche Konsequenzen sich daraus für Open-Source-Lizenzen ergeben, ist derzeit noch offen und betrifft auch andere Projekte, die diesen Datensatz oder Common Crawl aus dem Internet verwenden). Mit der Größe des Trainingsdatensatzes liegt StableLM gleichauf mit dem proprietären KI-Modell LLaMA von Meta AI, das ausgewählten Forschungsprojekten zur Verfügung gestellt wurde und durch einen Leak auch mit semi-offiziellen bis illegalen Ablegern im Netz kursiert.<h3 class=„subheading“ id=„nav_redpajama_baut2“>RedPajama baut LLaMA offen nach: Basisdatensatz verfügbar</h3>Ein weiteres Open-Source-Projekt arbeitet mit einem selbst erstellten Datensatz in ähnlichem Umfang: Mitte April 2023, wenige Tage vor dem Release von StableLM, hat eine hochkarätige Forschungskooperation aus den USA und Kanada mit Partnern den <a href=„https://www.heise.de/news/LLaMA-Nachbau-RedPajama-erste-dezentrale-Open-Source-KI-mit-offenem-Datensatz-8971752.html“>Trainingsdatensatz für RedPajama veröffentlicht, der 1,2 Billionen Token umfasst [7]</a> und ebenfalls das LLaMA-Paper als Vorbild nahm. RedPajama plant, eine quelloffene Modellserie auf dem neuesten Stand der Technik mit starken Leistungswerten zu veröffentlichen und das nicht freigegebene LLaMA so in Eigenregie in freier Lizenz nachzubauen. Anders als StableLM steht zumindest der Datensatz von RedPajama unter der Apache-2.0-Lizenz, damit trainierte Modelle und Anwendungen können uneingeschränkt auch kommerziell genutzt werden.<h3 class=„subheading“ id=„nav_laion_und_der3“>LAION und der Offene Brief</h3>Das an RedPajama beteiligte Large-Scale Artificial Intelligence Open Network (LAION e.V.) hatte zuvor angekündigt, dass Mitglieder des Netzwerkes große KI-Sprachmodelle auf dem neuesten Stand der Technik und mit vergleichbaren Fähigkeiten zu den leistungsfähigsten kommerziellen Angeboten erstellen wollen. Eine Petition zum <a href=„https://www.heise.de/news/Open-Source-KI-LAION-ruft-zu-offenem-GPT-4-Nachbau-auf-genug-Wissen-sei-da-8651446.html“>Einrichten eines internationalen Hochleistungs-Rechenclusters für KI läuft zurzeit [8]</a>, auch als Antwort auf den <a href=„https://www.heise.de/news/Tech-Prominenz-fordert-Pausiert-die-Entwicklung-der-Riesen-KI-Modelle-8178216.html“>Offenen Brief des Future of Life Institute [9]</a>, unterzeichnet von Elon Musk und weiteren Prominenten, die eine Entwicklungspause für große KI-Modelle gefordert hatten.Zugleich hatte Musk eine eigene KI-Unternehmung angekündigt, die unter der Domain x.ai und mit dem Arbeitsnamen <a href=„https://www.heise.de/news/TruthGPT-Musk-warnt-vor-luegendem-ChatGPT-eigene-KI-sei-beste-Moeglichkeit-8970175.html“>TruthGPT in Konkurrenz zu OpenAI [10]</a> treten soll. Dass es sich hierbei um Open-Source-KI handeln wird, ist eher unwahrscheinlich.<h3 class=„subheading“ id=„nav_forschungsmodell4“>Forschungsmodelle mitveröffentlicht</h3>Neben den Alphaversionen von StableLM veröffentlicht Stability AI eine Reihe von Forschungsmodellen, die mit Anweisungen feingetuned sind. Diese Forschungsmodelle greifen auf Kombinationen verschiedener Open-Source-Datensätze für agentische Konversations-KI zu, nämlich auf die Datensätze von Alpaca, GPT4All, Dolly, ShareGPT und HH. Diese Modelle sind ausdrücklich nicht für kommerzielle Zwecke geeignet und dürfen nur zu Forschungszwecken verwendet werden. Ihre Lizenz ist eine nichtkommerzielle CC BY-NC-SA 4.0, analog zur Lizenz von Alpaca der Universität Stanford (einem der zahlreichen LLaMA-Ableger, die zu Forschungszwecken seitens Meta AI erlaubt waren).Im Blogeintrag zum Release finden sich einige Konversationsbeispiele von StableLM-7B, dem größeren der beiden nun veröffentlichten Modelle. StableLM reiht sich nahtlos in die Bewegung inzwischen entstehender quelloffener KI-Modelle ein. Drei Schlagwörter liefert Stability AI zur Zielsetzung: Transparenz, Zugänglichkeit und Unterstützung. Die Open-Source-Modelle seien dazu da, die Nutzer zu unterstützen, nicht hingegen, sie zu ersetzen. Es gehe um effizente, spezialisierte und praktische KI-Anwendungen, die auch mit kleineren Modellen umzusetzen sei. Am Rennen um „Gott-gleiche KI“ wolle man sich ausdrücklich nicht beteiligen. Der Fokus liegt auf Alltagsanwendungen und einem Einsatz, der die Produktivität erhöht sowie die Menschen kreativer werden lässt, so die Stellungenahme im Blogeintrag.Für Forscher ist relevant, dass sie den so veröffentlichten Modellen „unter die Haube schauen“ können, um gemeinschaftlich die Nachvollziehbarkeit und Erklärbarkeit von KI-Modellen zu verbessern, Risiken zu identifizieren und Sicherheitsmaßnahmen zu entwickeln. Privater und öffentlicher Bereich können Open-Source-Modelle an ihre Zwecke anpassen (Finetuning), ohne sensible Daten zu teilen oder die Kontrolle der KI-Fähigkeiten preiszugeben.<h3 class=„subheading“ id=„nav_technischer5“>Technischer Bericht folgt</h3><a href=„https://github.com/stability-AI/stableLM/“ rel=„external noopener“ target=„_blank“>StableLM ist im GitHub-Repository [11]</a> von Stability AI verfügbar. Ein technischer Bericht und Benchmarks zum Leistungsvergleich liegen zurzeit noch nicht vor, sollen aber „in der nahen Zukunft“ nachgereicht werden. Gleichzeitig mit dem Release beginnt ein Crowdsourcing-Programm für Reinforcement Learning mit menschlichem Feedback (RLHF), einer üblichen Praxis zum Finetunen großer Sprachmodelle.Als Vorbild dienen hierbei <a href=„https://www.heise.de/news/OpenAssistant-an-open-Alternative-to-ChatGPT-Conversational-AI-for-Everyone-8971294.html“>Community-Arbeiten wie bei OpenAssistant [12]</a>, dessen Projekt in gemeinschaftlicher Arbeit einen hochwertigen, qualitätsgesicherten und frei zugänglichen Basisdatensatz für KI-Assistenten veröffentlicht hat. <a href=„https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models“ rel=„external noopener“ target=„_blank“>Weitere Details [13]</a> lassen sich dem Blogeintrag entnehmen.() URL dieses Artikels:<code>https://www.heise.de/-8973343</code>Links in diesem Artikel:<code>[1] https://creativecommons.org/licenses/by-sa/4.0/deed.de</code><code>[2] https://www.heise.de/hintergrund/Chancen-und-Risiken-Copyleft-in-der-Softwareentwicklung-4926808.html</code><code>[3] https://www.heise.de/news/Copyleft-org-Was-Sie-schon-immer-ueber-die-GPL-wissen-wollten-2445300.html</code><code>[4] https://www.heise.de/news/OpenAssistant-an-open-Alternative-to-ChatGPT-Conversational-AI-for-Everyone-8971294.html</code><code>[5] https://arxiv.org/abs/2101.00027</code><code>[6] https://twitter.com/sepia_fw/status/1648721507919491073</code><code>[7] https://www.heise.de/news/LLaMA-Nachbau-RedPajama-erste-dezentrale-Open-Source-KI-mit-offenem-Datensatz-8971752.html</code><code>[8] https://www.heise.de/news/Open-Source-KI-LAION-ruft-zu-offenem-GPT-4-Nachbau-auf-genug-Wissen-sei-da-8651446.html</code><code>[9] https://www.heise.de/news/Tech-Prominenz-fordert-Pausiert-die-Entwicklung-der-Riesen-KI-Modelle-8178216.html</code><code>[10] https://www.heise.de/news/TruthGPT-Musk-warnt-vor-luegendem-ChatGPT-eigene-KI-sei-beste-Moeglichkeit-8970175.html</code><code>[11] https://github.com/stability-AI/stableLM/</code><code>[12] https://www.heise.de/news/OpenAssistant-an-open-Alternative-to-ChatGPT-Conversational-AI-for-Everyone-8971294.html</code><code>[13] https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models</code><code>[14] mailto:sih@ix.de</code>Copyright © 2023 Heise Medien </html>

Qgelm

Seiten-Werkzeuge

Webseiten-Werkzeuge

Benutzer-Werkzeuge

StableLM: Stability AI veröffentlicht große KI-Sprachmodelle als Open Source