feat: tokenizers (#407)

* feat: autobuild tiktoken lib and schenanigans Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * chore: revert readme changes Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * fix(build): windows Signed-off-by: Hanchin Hsieh <me@yuchanns.xyz> * chore(plugin): early load commands and base setup Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * fix(build): make sync Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * feat: rust go vroom vroom Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * feat: scuffed afaf implementation binding go brrrr Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * chore: remove dups Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * fix(tokens): calculate whether we should do prompt_caching (fixes #416) Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * chore: ignore lockfiles Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * Update README.md * Update crates/avante-tokenizers/README.md * chore: remove unused Signed-off-by: Aaron Pham <contact@aarnphm.xyz> * chore: remove auto build Signed-off-by: Aaron Pham <contact@aarnphm.xyz> --------- Signed-off-by: Aaron Pham <contact@aarnphm.xyz> Signed-off-by: Hanchin Hsieh <me@yuchanns.xyz> Co-authored-by: yuchanns <me@yuchanns.xyz>
2024-08-31 07:19:59 -04:00
parent 81b44e4533
commit d2095ba267
27 changed files with 3554 additions and 27 deletions
--- a/lua/avante/providers/azure.lua
+++ b/lua/avante/providers/azure.lua
@@ -12,6 +12,7 @@ local O = require("avante.providers").openai
 local M = {}

 M.api_key_name = "AZURE_OPENAI_API_KEY"
+M.tokenizer_id = "gpt-4o"

 M.parse_message = O.parse_message
 M.parse_response = O.parse_response
--- a/lua/avante/providers/claude.lua
+++ b/lua/avante/providers/claude.lua
@@ -6,6 +6,7 @@ local P = require("avante.providers")
 local M = {}

 M.api_key_name = "ANTHROPIC_API_KEY"
+M.tokenizer_id = "gpt-4o"

 ---@param prompt_opts AvantePromptOptions
 M.parse_message = function(prompt_opts)
@@ -28,8 +29,10 @@ M.parse_message = function(prompt_opts)
    local user_prompt_obj = {
      type = "text",
      text = user_prompt,
-      cache_control = { type = "ephemeral" },
    }
+    if Utils.tokens.calculate_tokens(user_prompt_obj.text) > 1024 then
+      user_prompt_obj.cache_control = { type = "ephemeral" }
+    end

    table.insert(message_content, user_prompt_obj)
  end
--- a/lua/avante/providers/cohere.lua
+++ b/lua/avante/providers/cohere.lua
@@ -29,6 +29,7 @@ local P = require("avante.providers")
 local M = {}

 M.api_key_name = "CO_API_KEY"
+M.tokenizer_id = "CohereForAI/c4ai-command-r-plus-08-2024"

 M.parse_message = function(opts)
  local user_prompt = table.concat(opts.user_prompts, "\n\n")
--- a/lua/avante/providers/copilot.lua
+++ b/lua/avante/providers/copilot.lua
@@ -127,6 +127,7 @@ end
 M.state = nil

 M.api_key_name = P.AVANTE_INTERNAL_KEY
+M.tokenizer_id = "gpt-4o"

 M.parse_message = function(opts)
  return {
@@ -166,6 +167,7 @@ M.setup = function()
    M.state = { github_token = nil, oauth_token = H.get_oauth_token() }
    H.refresh_token()
  end
+  require("avante.tokenizers").setup(M.tokenizer_id)
  vim.g.avante_login = true
 end

--- a/lua/avante/providers/gemini.lua
+++ b/lua/avante/providers/gemini.lua
@@ -6,6 +6,7 @@ local Clipboard = require("avante.clipboard")
 local M = {}

 M.api_key_name = "GEMINI_API_KEY"
+M.tokenizer_id = "google/gemma-2b"

 M.parse_message = function(opts)
  local message_content = {}
--- a/lua/avante/providers/init.lua
+++ b/lua/avante/providers/init.lua
@@ -69,6 +69,7 @@ local Dressing = require("avante.ui.dressing")
 ---@field setup fun(): nil
 ---@field has fun(): boolean
 ---@field api_key_name string
+---@field tokenizer_id string | "gpt-4o"
 ---@field model? string
 ---@field parse_api_key fun(): string | nil
 ---@field parse_stream_data? AvanteStreamParser
@@ -269,6 +270,11 @@ M = setmetatable(M, {
      return E.parse_envvar(t[k])
    end

+    -- default to gpt-4o as tokenizer
+    if t[k].tokenizer_id == nil then
+      t[k].tokenizer_id = "gpt-4o"
+    end
+
    if t[k].has == nil then
      t[k].has = function()
        return E.parse_envvar(t[k]) ~= nil
@@ -280,6 +286,7 @@ M = setmetatable(M, {
        if not E.is_local(k) then
          t[k].parse_api_key()
        end
+        require("avante.tokenizers").setup(t[k].tokenizer_id)
      end
    end

--- a/lua/avante/providers/openai.lua
+++ b/lua/avante/providers/openai.lua
@@ -26,6 +26,7 @@ local P = require("avante.providers")
 local M = {}

 M.api_key_name = "OPENAI_API_KEY"
+M.tokenizer_id = "gpt-4o"

 ---@param opts AvantePromptOptions
 M.get_user_message = function(opts)