首页
/ 正文

docker ollama（手把手讲解）

更新时间: 2025-03-16 11:02:08

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

前言

在当今人工智能技术快速发展的背景下，大模型的应用场景日益广泛。然而，部署和运行这些模型通常面临资源消耗高、环境配置复杂等挑战。Docker 和 Ollama 的结合，为开发者提供了一种轻量、高效的解决方案。本文将从基础概念出发，逐步讲解如何通过 Docker 容器化 Ollama，并通过实际案例展示其在开发中的具体应用。无论是编程新手还是有一定经验的开发者，都能从中获得实用的技术洞见。

基础概念解析：Docker 与 Ollama 的核心价值

Docker：容器化的“集装箱”

Docker 是一种容器化技术，它将应用程序及其依赖项封装到一个独立的容器中。想象一下，Docker 就像一个标准化的集装箱——无论货物（应用程序）是什么，都可以通过统一的接口快速运输（部署）。它的核心优势包括：

环境一致性：避免“在我的机器上能运行”的尴尬，确保不同开发环境或生产环境的一致性。
资源隔离：每个容器独立运行，互不干扰，降低系统风险。
快速部署：通过预构建的镜像快速启动服务。

Ollama：轻量级的本地大模型服务

Ollama 是由 OpenAI 支持的开源项目，旨在简化大模型的本地部署。它允许开发者将大模型（如 Llama、Qwen、Qwen-VL 等）封装为轻量级的独立服务，支持通过 API 快速调用。其核心特点包括：

低资源占用：通过模型量化和优化技术，减少内存和存储需求。
灵活调用：提供 REST API 接口，方便集成到各类应用中。
模型即服务：每个模型独立运行，支持快速扩展。

为何需要 Docker + Ollama？

虽然 Ollama 本身已经简化了模型部署，但结合 Docker 可以进一步提升灵活性和可维护性。例如：

环境隔离：避免不同模型或版本间的依赖冲突。
一键部署：通过 Docker 镜像快速复制生产环境配置。
资源管理：利用 Docker 的资源限制功能，避免单个模型占用过多资源。

快速上手：Docker 与 Ollama 的整合步骤

步骤 1：安装 Docker

首先确保本地已安装 Docker。对于 macOS 或 Windows 用户，可通过 Docker Desktop 安装；Linux 用户可通过命令行安装：

sudo apt-get update  
sudo apt-get install docker.io

步骤 2：安装 Ollama

Ollama 的安装同样简单。访问其官方文档或直接通过以下命令安装：

curl -fsSL https://ollama.ai/install.sh | sudo sh

安装完成后，可通过 ollama version 验证版本号。

步骤 3：创建 Docker 镜像

接下来，我们将 Ollama 的运行环境打包为 Docker 镜像。创建一个 Dockerfile 文件：

FROM alpine:3.18  

RUN apk add --no-cache ollama  

EXPOSE 11434  

CMD ["ollama", "serve"]

通过以下命令构建镜像：

docker build -t ollama-container .

步骤 4：运行容器化 Ollama

启动容器时，需映射端口并挂载本地目录（用于存储模型文件）：

docker run -d \  
  --name ollama-container \  
  -p 11434:11434 \  
  -v $HOME/.ollama:/root/.ollama \  
  ollama-container

验证部署

访问 http://localhost:11434/v1/models，若返回空列表则表示 Ollama 容器已成功运行。

实战案例：通过 Docker 化 Ollama 调用 Llama 2 模型

案例目标

创建一个 Docker 容器，部署 Llama 2 模型，并通过 API 调用生成文本。

步骤 1：拉取 Llama 2 模型

在容器内运行以下命令拉取模型：

docker exec -it ollama-container ollama pull llama2

步骤 2：编写调用脚本

创建一个 Python 脚本 query_llama.py，通过 HTTP 请求调用模型：

import requests  

prompt = "解释量子计算的基本原理"  
response = requests.post(  
    "http://localhost:11434/api/predict",  
    json={"model": "llama2", "prompt": prompt}  
)  
print(response.json()["response"])

步骤 3：运行并测试

执行脚本并观察输出。若成功，将看到类似以下结果：

量子计算利用量子力学中的叠加和纠缠现象，通过量子比特（qubits）进行计算。与传统二进制位不同，量子比特可以同时处于多种状态，从而在特定问题（如大数分解）上实现指数级加速。

深入思考：容器化的优势

通过 Docker 化 Ollama，我们实现了：

环境隔离：即使未来升级 Ollama 或添加其他模型，现有容器仍保持稳定。
可移植性：将镜像推送到 Docker Hub 后，可在任意支持 Docker 的环境快速复现。

高级技巧与最佳实践

技巧 1：优化资源使用

通过 Docker 的资源限制功能，避免模型占用过多内存：

docker run \  
  --memory="4g" \  # 限制内存为4GB  
  --cpus="2" \     # 限制 CPU 核数为2  
  ...其他参数

技巧 2：多模型并行部署

若需同时运行多个模型，可为每个模型创建独立容器：

docker run -d \  
  --name ollama-llama2 \  
  -p 11434:11434 \  
  ollama-container  

docker run -d \  
  --name ollama-qwen \  
  -p 11435:11434 \  # 映射不同端口  
  ollama-container

技巧 3：利用 Docker Compose 简化管理

通过 docker-compose.yml 管理多个服务：

version: '3'  
services:  
  ollama-llama2:  
    build: .  
    ports:  
      - "11434:11434"  
    volumes:  
      - $HOME/.ollama:/root/.ollama  

  ollama-qwen:  
    build: .  
    ports:  
      - "11435:11434"

总结与展望

通过本文的讲解，我们看到了 docker ollama 组合的强大功能：它将容器化的灵活性与轻量化模型部署的优势结合，为开发者提供了一个高效、易维护的 AI 开发环境。无论是快速验证模型效果，还是构建生产级应用，这种技术栈都能显著提升开发效率。

未来，随着大模型技术的进一步发展，Docker 与 Ollama 的整合将有更多可能性。例如，结合 Kubernetes 实现大规模模型服务化，或是通过自定义镜像优化特定场景的性能。对于开发者而言，掌握这一技术组合，将为应对未来的 AI 应用挑战打下坚实的基础。

希望本文能为你打开探索容器化 AI 部署的大门，如果你有任何问题或实践中的经验，欢迎在评论区分享！

docker ollama（手把手讲解）

前言

基础概念解析：Docker 与 Ollama 的核心价值

Docker：容器化的“集装箱”

Ollama：轻量级的本地大模型服务

为何需要 Docker + Ollama？

快速上手：Docker 与 Ollama 的整合步骤

步骤 1：安装 Docker

步骤 2：安装 Ollama

步骤 3：创建 Docker 镜像

步骤 4：运行容器化 Ollama

验证部署

实战案例：通过 Docker 化 Ollama 调用 Llama 2 模型

案例目标

步骤 1：拉取 Llama 2 模型

步骤 2：编写调用脚本

步骤 3：运行并测试

深入思考：容器化的优势

高级技巧与最佳实践

技巧 1：优化资源使用

技巧 2：多模型并行部署

技巧 3：利用 Docker Compose 简化管理

总结与展望

最新发布

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）

IMAP 协议（保姆级教程）

RDP 协议（建议收藏）

SFTP 协议（保姆级教程）

UDP 协议（长文解析）