使用 Ollama 运行代码生成模型如何调整 temperature 参数降低随机性

在 Ollama 中运行代码生成模型时，将 temperature 参数调低（例如 0.1 到 0.3 之间）是降低输出随机性、提高代码稳定性的最直接方法，适合对语法准确性要求较高的场景。

先说结论：降低 temperature 值能让模型输出更确定，但过低可能导致内容重复，需根据具体模型微调。

命令速用版

如果你希望通过命令行快速测试，可以在运行模型时直接传入参数（取决于 Ollama 版本支持）：

ollama run <model-name> `--options` temperature=0.2

更推荐的方式是创建自定义模型配置文件，以便持久化生效：

FROM <model-name>
PARAMETER temperature 0.2

temperature 参数控制模型生成下一个 token 时的概率分布。数值越高，模型选择低概率词的可能性越大，输出越多样但也越不可控；数值越低，模型越倾向于选择概率最高的词，输出更稳定。代码生成通常逻辑严密，不需要过多的“创造性”，因此低温更合适。

使用完全相同的提示词（例如“写一个 Python 快速排序函数”）连续请求 3 次。如果 temperature 设置较低，三次生成的代码结构和变量名应高度相似；若设置较高，实现细节会有明显差异。也可以通过 API 返回的日志观察 token 概率分布，但直接对比文本效率更高。

Ollama GitHub Repository, Modelfile documentation
Ollama Official Documentation, API parameters (https://github.com/ollama/ollama)