Skip to content
登录/注册
Model avatar

Gemini 3.1 Flash Lite Preview

gemini
上下文窗口
1.0M
创建时间
2026/04/30

Gemini 3.1 Flash Lite Preview 是 Google 针对大容量用例进行优化的高效模型。它在整体质量上优于 Gemini 2.5 Flash Lite,并在关键功能方面接近 Gemini 2.5 Flash 性能。改进涵盖音频输入/ASR、RAG 片段排名、翻译、数据提取和代码完成。支持完整的思维级别(最低、低、中、高)以实现细粒度的成本/性能权衡。价格仅为 Gemini 3 Flash 成本的一半。

模型价格

计费项价格
输入1.8285元 / 1M
缓存命中输入0.18285元 / 1M
缓存写入0.609476元 / 1M
输出10.971元 / 1M

API 接入信息

Model ID
gemini-3.1-flash-lite-preview
用于在推理接口中指定模型
API Key
前往 API Key 管理查看
用于设置推理接口的 Bearer Token(OAuth 2.0 认证令牌)
OpenAI BaseURL
OpenAIhttps://api.atalk-ai.com/v2/
兼容 OpenAI 接口(即 /chat/completions),支持 OpenAI SDK、Codex 等

模型能力

输入
文本 图像
输出
文本

gemini-3.1-flash-lite-preview 接入示例

海鲸AI 兼容 OpenAI 接口协议,可直接使用 OpenAI SDK 或 HTTP 请求接入,默认开启流式输出。

js
curl https://api.atalk-ai.com/v2/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <API_KEY>" \
  -d '{
    "model": "gemini-3.1-flash-lite-preview",
    "messages": [
      {"role": "system", "content": "你是一个有帮助的助手。"},
      {"role": "user", "content": "你好!"}
    ],
    "stream": true
  }'
js
from openai import OpenAI

client = OpenAI(
    base_url="https://api.atalk-ai.com/v2",
    api_key="<API_KEY>",
)

stream = client.chat.completions.create(
    model="gemini-3.1-flash-lite-preview",
    messages=[
        {"role": "system", "content": "你是一个有帮助的助手。"},
        {"role": "user", "content": "你好!"},
    ],
    stream=True,
)

for chunk in stream:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)
js
import OpenAI from 'openai'

const client = new OpenAI({
  baseURL: 'https://api.atalk-ai.com/v2',
  apiKey: '<API_KEY>',
})

const stream = await client.chat.completions.create({
  model: 'gemini-3.1-flash-lite-preview',
  messages: [
    { role: 'system', content: '你是一个有帮助的助手。' },
    { role: 'user', content: '你好!' },
  ],
  stream: true,
})

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content ?? '')
}