{"id":16091,"date":"2024-03-02T21:54:03","date_gmt":"2024-03-02T20:54:03","guid":{"rendered":"https:\/\/polluxlabs.net\/?p=16091"},"modified":"2025-03-07T18:05:47","modified_gmt":"2025-03-07T17:05:47","slug":"mit-ollama-sprachmodelle-lokal-nutzen","status":"publish","type":"post","link":"https:\/\/polluxlabs.net\/raspberry-pi-projekte\/mit-ollama-sprachmodelle-lokal-nutzen\/","title":{"rendered":"Mit Ollama Sprachmodelle lokal nutzen"},"content":{"rendered":"\n<p>Hier auf Pollux Labs konntest du bereits dar\u00fcber lesen, wie du z.B. die API von OpenAI nutzt, um mit ChatGPT zu interagieren. Aber das geht auch <strong>lokal auf deinem eigenen Rechner<\/strong> \u2013 zwar nicht mit ChatGPT, daf\u00fcr jedoch mit anderen Sprachmodellen wie Mistral, Gemma, Llama2 und vielen anderen. <strong>Hierf\u00fcr nutzt du das Tool Ollama.<\/strong> In diesem Tutorial erf\u00e4hrst du, wie du es<strong> installierst, einrichtest und mit Python mit dem Modell deiner Wahl interagierst.<\/strong><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ollama installieren<\/h2>\n\n\n\n<p>Wenn du einen Mac oder Windows benutzt, musst du Ollama erst <a href=\"https:\/\/ollama.com\/download\" target=\"_blank\" rel=\"noreferrer noopener\">hier auf der offziellen Webseite herunterladen<\/a>.<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"1160\" height=\"712\" src=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-herunterladen.png\" alt=\"Ollama herunterladen\" class=\"wp-image-16096\" srcset=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-herunterladen.png 1160w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-herunterladen-300x184.png 300w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-herunterladen-1024x629.png 1024w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-herunterladen-768x471.png 768w\" sizes=\"(max-width: 1160px) 100vw, 1160px\" \/><\/figure>\n\n\n\n<p>Falls du Linux verwendest, gib im Terminal den folgenden Befehl ein:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>curl -fsSL https:\/\/ollama.com\/install.sh | sh<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Entpacke nach dem Download die ZIP-Datei (Mac) und starte das Programm oder starte direkt die .exe (Windows). Anschlie\u00dfend f\u00fchrt dich ein Wizard durch die n\u00e4chsten Schritte, damit du Ollama im Terminal verwenden kannst. Am Ende erh\u00e4ltst du den Befehl f\u00fcr einen ersten Test.<\/p>\n\n\n\n<div id=\"steady_paywall\" data-utm-campaign=\"raspi-ollama\" style=\"display: none;\"><\/div>\n\n\n\n<figure class=\"wp-block-image aligncenter size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"616\" height=\"764\" src=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-installiert.png\" alt=\"Ollama-Wizard\" class=\"wp-image-16097\" srcset=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-installiert.png 616w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Ollama-installiert-242x300.png 242w\" sizes=\"(max-width: 616px) 100vw, 616px\" \/><\/figure>\n\n\n\n<p>Kopiere den Befehl und gib in im Terminal bzw. der Konsole ein. Anschlie\u00dfend wird das Sprachmodell <a href=\"https:\/\/llama.meta.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">Llama2<\/a> heruntergeladen. Dieses Modell stammt vom Facebook-Konzert Meta. Wie du auf dem Bild unten siehst, ist das mit 3,8 Gigabyte nicht gerade klein \u2013 achte also auf gen\u00fcgend Speicherplatz.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"108\" src=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Download-Llama2-im-Terminal-1024x108.png\" alt=\"Download von Llama2 im Terminal\" class=\"wp-image-16099\" srcset=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Download-Llama2-im-Terminal-1024x108.png 1024w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Download-Llama2-im-Terminal-300x32.png 300w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Download-Llama2-im-Terminal-768x81.png 768w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Download-Llama2-im-Terminal.png 1138w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Ollama im Terminal verwenden<\/h2>\n\n\n\n<p>Um mit deinem ersten Sprachmodell (Llama2) loszulegen, kannst du direkt im selben Fenster bleiben. Du erh\u00e4ltst nach der erfolgreichen Installation eine Eingabeaufforderung, \u00fcber die du deine erste Frage stellen kannst \u2013 so wie du es vermutlich bereits von ChatGPT kennst. Nach wenigen Sekunden erh\u00e4ltst du dann die Antwort ebenfalls im Terminal:<\/p>\n\n\n\n<figure class=\"wp-block-image aligncenter size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"191\" src=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Llama2-ueber-Ollama-im-Terminal-1024x191.png\" alt=\"Llama2 \u00fcber Ollama im Terminal\" class=\"wp-image-16102\" srcset=\"https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Llama2-ueber-Ollama-im-Terminal-1024x191.png 1024w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Llama2-ueber-Ollama-im-Terminal-300x56.png 300w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Llama2-ueber-Ollama-im-Terminal-768x143.png 768w, https:\/\/polluxlabs.net\/wp-content\/uploads\/2024\/03\/Llama2-ueber-Ollama-im-Terminal.png 1136w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Das funktioniert also schon einmal ganz gut. Das Beispiel oben ist auf Englisch \u2013 <strong>du kannst deine Fragen jedoch auch ebenso auf Deutsch stellen.<\/strong> <strong>Die Antwort erh\u00e4ltst du von Llama2 jedoch wiederum auf Englisch.<\/strong> Um Antworten auf Deutsch zu erhalten f\u00fcge deinem Prompt noch eine entsprechende Anweisung hinzu.<\/p>\n\n\n\n<p>Wenn du deine Session beenden m\u00f6chtest, gib einfach den Befehl <strong>\/bye<\/strong> ein.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Ein anderes Sprachmodell in Ollama installieren<\/h3>\n\n\n\n<p>Du bist nat\u00fcrlich nicht auf Llama2 beschr\u00e4nkt. Auf der <a href=\"https:\/\/ollama.com\/library\" target=\"_blank\" rel=\"noreferrer noopener\">Ollama-Webseite<\/a> sowie auf deren <a href=\"https:\/\/github.com\/ollama\/ollama\" target=\"_blank\" rel=\"noreferrer noopener\">GitHub-Seite<\/a> kannst du alle verf\u00fcgbaren Sprachmodelle einsehen. Auf letzterer erf\u00e4hrst du auch, wieviel Arbeitsspeicher du f\u00fcr die verschiedenen Modelle haben solltest. Versuche es doch als n\u00e4chstes einmal mit <a href=\"https:\/\/mistral.ai\/\" target=\"_blank\" rel=\"noreferrer noopener\">Mistral<\/a>, einem frei verf\u00fcgbaren franz\u00f6sischen Modell (das auch Deutsch kann). Gib hierf\u00fcr im Terminal folgenden Befehl ein, nachdem du deine aktive Session mit \/bye beendet hast:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>ollama run mistral<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Nach der Installation kannst du mit Mistral interagieren, so wie du es vorher mit Llama2 getan hast.<\/p>\n\n\n\n<p>Das Sprachmodell von Mistral ist mit 4,1 GB sogar noch etwas gr\u00f6\u00dfer als Llama2. Es ist also hilfreich zu wissen, wie du installierte Modelle wieder loswirst. Ganz einfach \u2013 Um z.B. Llama2 zu entfernen, gib im Terminal den folgenden Befehl ein:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>ollama rm llama2<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Falls du vergessen hast, welche Modelle du gerade installiert hast, hilft dir folgender Befehl weiter:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>ollama list<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Ollama mit Python verwenden<\/h2>\n\n\n\n<p>Bis jetzt hast du &#8222;nur&#8220; im Terminal mit deinem lokalen Sprachmodell kommuniziert. Du kannst aber hierf\u00fcr nat\u00fcrlich auch ein Python-Script verwenden, \u00e4hnlich wie ich es <a href=\"https:\/\/polluxlabs.net\/python-tutorials-und-projekte\/die-chatgpt-api-mit-python-verwenden\/\">hier schon einmal f\u00fcr ChatGPT beschrieben habe<\/a>.<\/p>\n\n\n\n<p>Zun\u00e4chst musst du hierf\u00fcr die entsprechende Bibliothek installieren:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>pip install ollama<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Erstelle nach der erfolgreichen Installation ein leeres Python-Script mit folgendem Inhalt:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code><span class=\"pl-k\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-keyword);\">import<\/span> <span class=\"pl-s1\" style=\"box-sizing: border-box;\">ollama<\/span>\n<span class=\"pl-s1\" style=\"box-sizing: border-box;\">response<\/span> <span class=\"pl-c1\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-constant);\">=<\/span> <span class=\"pl-s1\" style=\"box-sizing: border-box;\">ollama<\/span>.<span class=\"pl-en\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-entity);\">chat<\/span>(<span class=\"pl-s1\" style=\"box-sizing: border-box;\">model<\/span><span class=\"pl-c1\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-constant);\">=<\/span><span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'mistral'<\/span>, <span class=\"pl-s1\" style=\"box-sizing: border-box;\">messages<\/span><span class=\"pl-c1\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-constant);\">=<\/span>&#91;\n  {\n    <span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'role'<\/span>: <span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'user'<\/span>,\n    <span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'content'<\/span>: <span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'Welche Farben k\u00f6nnen B\u00e4ren haben? Antworte auf Deutsch.'<\/span>,\n  },\n])\n<span class=\"pl-en\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-entity);\">print<\/span>(<span class=\"pl-s1\" style=\"box-sizing: border-box;\">response<\/span>&#91;<span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'message'<\/span>]&#91;<span class=\"pl-s\" style=\"box-sizing: border-box; color: var(--color-prettylights-syntax-string);\">'content'<\/span>])<path d=\"M0 6.75C0 5.784.784 5 1.75 5h1.5a.75.75 0 0 1 0 1.5h-1.5a.25.25 0 0 0-.25.25v7.5c0 .138.112.25.25.25h7.5a.25.25 0 0 0 .25-.25v-1.5a.75.75 0 0 1 1.5 0v1.5A1.75 1.75 0 0 1 9.25 16h-7.5A1.75 1.75 0 0 1 0 14.25Z\"><\/path><path d=\"M5 1.75C5 .784 5.784 0 6.75 0h7.5C15.216 0 16 .784 16 1.75v7.5A1.75 1.75 0 0 1 14.25 11h-7.5A1.75 1.75 0 0 1 5 9.25Zm1.75-.25a.25.25 0 0 0-.25.25v7.5c0 .138.112.25.25.25h7.5a.25.25 0 0 0 .25-.25v-7.5a.25.25 0 0 0-.25-.25Z\"><\/path><div class=\"markdown-heading\" dir=\"auto\" style=\"box-sizing: border-box; position: relative; color: rgb(230, 237, 243); font-family: -apple-system, &quot;system-ui&quot;, &quot;Segoe UI&quot;, &quot;Noto Sans&quot;, Helvetica, Arial, sans-serif, &quot;Apple Color Emoji&quot;, &quot;Segoe UI Emoji&quot;; font-size: 16px; white-space-collapse: collapse; background-color: rgb(13, 17, 23);\"><\/div> <\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Im obigen Script ist wieder das Sprachmodell von Mistral hinterlegt. Falls du ein anderes verwendest, trage es in der zweiten Zeile hinter <strong>model=<\/strong> ein.<\/p>\n\n\n\n<p>Speiche die Datei nun ab und f\u00fchre sie aus. Vermutlich wirst du ziemlich lange warten m\u00fcssen, bis die Antwort erscheint. Das kannst du mit einem Stream verbessern \u2013 hierdurch erscheint die lange Antwort Wort f\u00fcr Wort zum Mitlesen. Verwende hierf\u00fcr den folgenden angepassten Code:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>import ollama\n\nstream = ollama.chat(\n    model='mistral',\n    messages=&#91;{'role': 'user', 'content': 'Welche Farben k\u00f6nnen B\u00e4ren haben? Anworte auf Deutsch'}],\n    stream=True,\n)\n\nfor chunk in stream:\n  print(chunk&#91;'message']&#91;'content'], end='', flush=True)<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Weitere Rollen verwenden<\/h2>\n\n\n\n<p>\u00c4hnlich wie bei ChatGPT kannst du auch in Ollama in deinen Rollen zuteilen. Wenn du also deine Antworten z.B. immer auf Deutsch erhalten m\u00f6chtest, hilft dir die Rolle <strong>system<\/strong> weiter. Dort kannst du die entsprechende Anweisung hinterlegen, sodass die Rolle <strong>user<\/strong> nur deine Frage enth\u00e4lt:<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>messages=&#91;{'role': 'user', 'content': 'Welche Farben k\u00f6nnen B\u00e4ren haben?'},\n          {'role': 'system', 'content': 'Antworte auf Deutsch'}],<\/code><\/pre>\n\n\n\n<div style=\"height:50px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p>Jetzt kennst du die Grundlagen, um mit Ollama auf deinem eigenen Rechner Sprachmodelle auszuf\u00fchren und in deine Projekte einzubinden. Es gibt nat\u00fcrlich noch viel mehr zu entdecken: Die verschiedenen Modelle besitzen alle unterschiedliche F\u00e4higkeiten \u2013 hier lohnt sich ein intensiver Blick, besonders da die Entwicklung nat\u00fcrlich nicht stehen bleibt.<\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hier auf Pollux Labs konntest du bereits dar\u00fcber lesen, wie du z.B. die API von OpenAI nutzt, um mit ChatGPT zu interagieren. Aber das geht auch lokal auf deinem eigenen Rechner \u2013 zwar nicht mit ChatGPT, daf\u00fcr jedoch mit anderen Sprachmodellen wie Mistral, Gemma, Llama2 und vielen anderen. Hierf\u00fcr nutzt du das Tool Ollama. In &hellip;<\/p>\n<p class=\"read-more\"> <a class=\"\" href=\"https:\/\/polluxlabs.net\/raspberry-pi-projekte\/mit-ollama-sprachmodelle-lokal-nutzen\/\"> <span class=\"screen-reader-text\">Mit Ollama Sprachmodelle lokal nutzen<\/span> Weiterlesen &raquo;<\/a><\/p>\n","protected":false},"author":1,"featured_media":16112,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"site-sidebar-layout":"","site-content-layout":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","footnotes":""},"categories":[219],"tags":[223],"class_list":["post-16091","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-raspberry-pi-projekte","tag-mitglieder"],"acf":[],"wp-worthy-pixel":{"ignored":false,"public":"08f281c344ee4378ac64ef267656a7dc","server":"vg04.met.vgwort.de","url":"https:\/\/vg04.met.vgwort.de\/na\/08f281c344ee4378ac64ef267656a7dc"},"wp-worthy-type":"normal","_links":{"self":[{"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/posts\/16091"}],"collection":[{"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/comments?post=16091"}],"version-history":[{"count":1,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/posts\/16091\/revisions"}],"predecessor-version":[{"id":17747,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/posts\/16091\/revisions\/17747"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/media\/16112"}],"wp:attachment":[{"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/media?parent=16091"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/categories?post=16091"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/polluxlabs.net\/wp-json\/wp\/v2\/tags?post=16091"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}