fix(providers): strip models/ prefix for Gemini OpenAI-compat endpoint (#175) (#186)

hqhq1025 · web-flow · commit 003d81b53686 · 2026-04-23T11:12:12.000+08:00
## Summary Fixes #175. Google's OpenAI-compatible endpoint at `https://generativelanguage.googleapis.com/v1beta/openai/` accepts the same request shape as OpenAI Chat Completions but rejects model ids carrying the `models/` prefix that its own `/models` listing returns, producing an opaque `400 status code (no body)` when routed through a custom provider (OpenAI Chat wire) configured with that baseUrl. - New helper `packages/providers/src/gemini-compat.ts` exposes `isGeminiOpenAICompat(baseUrl)` and `normalizeGeminiModelId(modelId, baseUrl)`. - `complete()` in `packages/providers/src/index.ts` normalizes the modelId on the wire only — Settings keeps the prefixed form so provider/model UX stays in sync with `/models`, while requests drop the prefix before hitting pi-ai. No changes to retry / errors / Settings UI / agent.ts / core. Skipped the OpenAI-specific param stripping step (presence_penalty / frequency_penalty / response_format): none of those keywords exist in `packages/providers`, `packages/core`, or `apps/desktop/src/main`, so pi-ai is not being handed Chat-specific knobs that Gemini would reject. ## Test plan - [x] Unit tests for `isGeminiOpenAICompat` and `normalizeGeminiModelId` (Gemini host, OpenAI host, undefined baseUrl, non-Gemini models/ id preserved). - [x] Integration test in `index.test.ts` verifying `complete({ modelId: 'models/gemini-2-pro', baseUrl: '.../generativelanguage.googleapis.com/...' })` sends bare `gemini-2-pro` to pi-ai. - [x] `pnpm exec vitest run` in `packages/providers`: 10 files, 141 tests passed. - [x] `pnpm typecheck` and `pnpm lint` green. ## PRINCIPLES §5b - Compatibility: green — only affects requests routed to Gemini host; Settings storage and UI unchanged. - Upgradeability: green — single-file helper, trivial to remove when Gemini normalizes its API. - No bloat: green — 18 lines of runtime code, no new deps. - Elegance: green — pure, local normalization at the wire boundary. --------- Signed-off-by: hqhq1025 <1506751656@qq.com>
diff --git a/packages/providers/src/gemini-compat.test.ts b/packages/providers/src/gemini-compat.test.ts
@@ -0,0 +1,65 @@
+import { describe, expect, it } from 'vitest';
+import { isGeminiOpenAICompat, normalizeGeminiModelId } from './gemini-compat';
+
+describe('isGeminiOpenAICompat', () => {
+  it('detects the official Gemini OpenAI-compat endpoint', () => {
+    expect(isGeminiOpenAICompat('https://generativelanguage.googleapis.com/v1beta/openai/')).toBe(
+      true,
+    );
+  });
+
+  it('returns false for non-Gemini bases', () => {
+    expect(isGeminiOpenAICompat('https://api.openai.com/v1')).toBe(false);
+  });
+
+  it('returns false when baseUrl is undefined', () => {
+    expect(isGeminiOpenAICompat(undefined)).toBe(false);
+  });
+
+  it('returns false when baseUrl is empty', () => {
+    expect(isGeminiOpenAICompat('')).toBe(false);
+  });
+
+  it('returns false when baseUrl is not a parseable URL', () => {
+    expect(isGeminiOpenAICompat('not a url')).toBe(false);
+  });
+
+  it('rejects spoofed URLs with Gemini host in query string', () => {
+    expect(
+      isGeminiOpenAICompat('https://attacker.com/?x=generativelanguage.googleapis.com/v1'),
+    ).toBe(false);
+  });
+
+  it('rejects spoofed URLs with Gemini host as subdomain suffix of attacker domain', () => {
+    expect(isGeminiOpenAICompat('https://generativelanguage.googleapis.com.evil.com/v1')).toBe(
+      false,
+    );
+  });
+
+  it('rejects spoofed URLs with Gemini host hyphenated into attacker domain', () => {
+    expect(isGeminiOpenAICompat('https://generativelanguage-googleapis-com.evil.com')).toBe(false);
+  });
+});
+
+describe('normalizeGeminiModelId', () => {
+  it('strips the models/ prefix for Gemini hosts', () => {
+    expect(
+      normalizeGeminiModelId(
+        'models/gemini-3.1-pro-preview',
+        'https://generativelanguage.googleapis.com/v1beta/openai/',
+      ),
+    ).toBe('gemini-3.1-pro-preview');
+  });
+
+  it('leaves non-Gemini model ids untouched', () => {
+    expect(normalizeGeminiModelId('gpt-4', 'https://api.openai.com/v1')).toBe('gpt-4');
+  });
+
+  it('does not strip models/ prefix when baseUrl is not a Gemini host', () => {
+    expect(normalizeGeminiModelId('models/foo', 'https://api.openai.com/v1')).toBe('models/foo');
+  });
+
+  it('is a no-op when baseUrl is undefined', () => {
+    expect(normalizeGeminiModelId('models/gemini-2-pro', undefined)).toBe('models/gemini-2-pro');
+  });
+});
diff --git a/packages/providers/src/gemini-compat.ts b/packages/providers/src/gemini-compat.ts
@@ -0,0 +1,26 @@
+/**
+ * Google's OpenAI-compatible endpoint
+ * (https://generativelanguage.googleapis.com/v1beta/openai/) accepts the same
+ * request shape as OpenAI Chat Completions but rejects model ids carrying the
+ * `models/` prefix that its own /models listing returns. Settings UI keeps the
+ * prefixed id (so it matches the /models response), and we strip it only on
+ * the wire. See issue #175.
+ */
+
+export function isGeminiOpenAICompat(baseUrl: string | undefined): boolean {
+  if (!baseUrl) return false;
+  try {
+    const { hostname } = new URL(baseUrl);
+    return (
+      hostname === 'generativelanguage.googleapis.com' ||
+      hostname.endsWith('.generativelanguage.googleapis.com')
+    );
+  } catch {
+    return false;
+  }
+}
+
+export function normalizeGeminiModelId(modelId: string, baseUrl: string | undefined): string {
+  if (!isGeminiOpenAICompat(baseUrl)) return modelId;
+  return modelId.replace(/^models\//, '');
+}
diff --git a/packages/providers/src/index.test.ts b/packages/providers/src/index.test.ts
@@ -303,6 +303,42 @@ describe('complete', () => {
       ),
     ).rejects.toMatchObject({ code: 'ATTACHMENT_TOO_LARGE' });
   });
+
+  it('strips models/ prefix from modelId when routing through Gemini OpenAI-compat endpoint', async () => {
+    getModelMock.mockReturnValue(undefined);
+    completeSimpleMock.mockImplementationOnce(async (piModel) => {
+      expect(piModel.id).toBe('gemini-2-pro');
+      return {
+        role: 'assistant',
+        content: [{ type: 'text', text: 'hi' }],
+        api: 'openai-completions',
+        provider: 'custom-gemini',
+        model: 'gemini-2-pro',
+        usage: {
+          input: 0,
+          output: 0,
+          cacheRead: 0,
+          cacheWrite: 0,
+          totalTokens: 0,
+          cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0, total: 0 },
+        },
+        stopReason: 'stop',
+        timestamp: Date.now(),
+      };
+    });
+
+    await complete(
+      { provider: 'custom-gemini', modelId: 'models/gemini-2-pro' },
+      [{ role: 'user', content: 'hello' }],
+      {
+        apiKey: 'token',
+        wire: 'openai-chat',
+        baseUrl: 'https://generativelanguage.googleapis.com/v1beta/openai/',
+      },
+    );
+
+    expect(getModelMock).toHaveBeenCalledWith('custom-gemini', 'gemini-2-pro');
+  });
 });
 
 describe('complete — openai-responses strict instructions', () => {
diff --git a/packages/providers/src/index.ts b/packages/providers/src/index.ts
@@ -18,6 +18,7 @@ import {
   looksLikeClaudeOAuthToken,
   shouldForceClaudeCodeIdentity,
 } from './claude-code-compat';
+import { normalizeGeminiModelId } from './gemini-compat';
 
 /** Subset of pi-ai's `ThinkingLevel` we expose. Maps directly to its `reasoning`
  * field, which Anthropic adapters translate to extended-thinking effort/budget
@@ -221,6 +222,11 @@ export async function complete(
   }
   const apiKey = opts.apiKey || 'open-codesign-keyless';
 
+  // Gemini's OpenAI-compat endpoint rejects the `models/` prefix that its own
+  // /models listing returns (issue #175). Normalize on the wire only; Settings
+  // keeps the prefixed form so provider/model UX stays in sync with /models.
+  const effectiveModelId = normalizeGeminiModelId(model.modelId, opts.baseUrl);
+
   const pi = (await import('@mariozechner/pi-ai')) as unknown as {
     getModel: (provider: string, modelId: string) => PiModel | undefined;
     completeSimple: (
@@ -238,12 +244,12 @@ export async function complete(
     ) => Promise<PiAssistantMessage>;
   };
 
-  let piModel = pi.getModel(model.provider, model.modelId);
+  let piModel = pi.getModel(model.provider, effectiveModelId);
   if (!piModel) {
     if (opts.wire !== undefined) {
-      piModel = synthesizeWireModel(model.provider, model.modelId, opts.wire, opts.baseUrl);
+      piModel = synthesizeWireModel(model.provider, effectiveModelId, opts.wire, opts.baseUrl);
     } else if (model.provider === 'openrouter') {
-      piModel = synthesizeOpenRouterModel(model.modelId);
+      piModel = synthesizeOpenRouterModel(effectiveModelId);
     } else {
       throw new CodesignError(
         `Unknown model ${model.provider}:${model.modelId}`,