In dieser Abbildung ist die Sprachverteilung von Teuken-7B-v0.4 dargestellt. Neben Code enthält Teuken-7B-v0.4 ca. 50 Prozent nicht-englischen Text aus 23 europäischen Ländern und ca. 40 Prozent englische Pretraining-Daten. SprachverteilungTEUKEN.webp image/webp Typ image/webp Dimension Abmessungen 1440x809 Size Dateigröße 26.2 KB Herunterladen Bild in voller Größe anzeigen…