Lange Textwurst in Scheiben schneiden

Momentan diktiere ich gerne wieder Texte. Mein Favorit ist gerade das Whisper-Modell von openai. Wenn ich nun draußen unterwegs bin und einen längeren Text diktiere, dann bekomme ich eine lange Textwurst als Transkript. 5000 Zeichen oder mehr in einer Zeile.

Um solche Textwürste zu zerteilen eignet sich ChatGPT. Ich gebe einfach ein: „Bitte unterteile den folgenden Text in sinnvolle Absätze." Keine Ahnung, warum ich so höflich bin, aber ich bin immer nett zu ChatGPT. AI-Bots sind ja schließlich auch nur Menschen. Äh, sind sie nicht.

Da ChatGPT aber nur Texte bis zu 4096 Zeichen bearbeitet, muss ich besonders lange Textwürste in Paketchen verteilen. Das ist mühsam. Aber es gibt ein CLI-Befehl, mit dem das wunderbar geht:

fold -w 4000 -s langewurst.txt | sed G > schoengeschnitten.txt

Mit dem Befehl im Terminal teilt Ihr den Text in jeweils 4000 Zeichen pro Zeile auf und damit die Pakete besser sichtbar sind, kommt noch eine Freizeile dazwischen (mit dem “sed” Befehl). Funktioniert hervorragend.