利用 Gemini for Research 加快发现速度

获取 Gemini API 密钥

Gemini 模型可用于推进各个学科的基础研究。您可以通过以下方式探索 Gemini 在研究方面的用途：

微调：您可以针对各种模态对 Gemini 模型进行微调，以推进研究。了解详情。
分析和控制模型输出：如需进一步分析，您可以使用 Logprobs 和 CitationMetadata 等工具检查模型生成的候选回答。您还可以配置模型生成和输出选项，例如 responseSchema、topP 和 topK。了解详情。
多模态输入：Gemini 可以处理图片、音频和视频，从而实现众多令人兴奋的研究方向。了解详情。
长上下文功能：Gemini 1.5 Flash 配备一个 100 万词元上下文窗口，而 Gemini 1.5 Pro 则配备一个 200 万词元上下文窗口。了解详情。
Google 成长计划：通过 API 和 Google AI Studio 快速访问 Gemini 模型，以用于生产用例。如果您正在寻找基于 Google Cloud 的平台，Vertex AI 可以提供额外的支持基础设施。

为了支持学术研究并推动前沿研究，Google 通过 Gemini 学术计划为科学家和学术研究人员提供 Gemini API 赠金。

开始使用 Gemini

借助 Gemini API 和 Google AI Studio，您可以开始使用 Google 的最新模型，并将您的想法转化为可扩缩的应用。

Python

from google import genai

client = genai.Client()
response = client.models.generate_content(
    model="gemini-2.0-flash",
    contents="How large is the universe?",
)

print(response.text)

JavaScript

import { GoogleGenAI } from "@google/genai";

const ai = new GoogleGenAI({});

async function main() {
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash",
    contents: "How large is the universe?",
  });
  console.log(response.text);
}

await main();

REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{
  "contents": [{
    "parts":[{"text": "How large is the universe?"}]
    }]
   }'

精选学术内容

“我们的研究从鲁棒性和安全性的角度，探讨了 Gemini 作为视觉语言模型 (VLM) 在各种环境中的智能体行为。到目前为止，我们已经评估了 Gemini 在 VLM 代理执行计算机任务时，针对弹出式窗口等干扰因素的鲁棒性，并利用 Gemini 分析了基于视频输入的社交互动、时间事件以及风险因素。”

“Gemini Pro 和 Flash 具有长上下文窗口，一直在帮助我们开展 OK-Robot 项目，这是一个开放词汇移动操作项目。Gemini 可针对机器人的“记忆”（在本例中是指机器人在长时间运行期间的先前观测结果）执行复杂的自然语言查询和命令。我和 Mahi Shafiullah 也在使用 Gemini 将任务分解为机器人可以在现实世界中执行的代码。”

Gemini 学术计划

支持的国家/地区中符合条件的学术研究人员（例如教职员工和博士生）可以申请获得 Gemini API 赠金和更高的速率限制，以便开展研究项目。此支持可提高科学实验的吞吐量，并推进研究。

我们对以下部分的研究领域特别感兴趣，但也欢迎来自不同科学学科的申请：

评估和基准：社区认可的评估方法，可在事实性、安全性、指令遵循、推理和规划等领域提供强有力的性能信号。
加速科学发现，造福人类：AI 在跨学科科学研究中的潜在应用，包括罕见病和被忽视的疾病、实验生物学、材料科学和可持续性等领域。
具身和互动：利用大语言模型，在具身 AI、环境互动、机器人技术和人机互动领域探索新颖的互动方式。
新兴功能：探索增强推理和规划所需的新代理功能，以及如何在推理过程中扩展功能（例如，通过利用 Gemini Flash）。
多模态交互和理解：确定多模态基础模型在各种任务中进行分析、推理和规划时的差距和机遇。

资格要求：只有隶属于有效学术机构或学术研究组织的个人（教职员工、研究人员或同等人员）可以申请。请注意，Google 会自行决定是否授予和移除 API 访问权限及赠金。我们会每月审核申请。

开始使用 Gemini API 进行研究

立即申请