【開発中】Gemini Pro/Gemini Pro Visionを日本人向けに使えるチュートリアルコード
【近況報告】
噂の高性能AIモデルGemini Pro・Gemini Pro Vision API活用に挑戦中
視聴時間:1分13秒
動画で紹介しているリンクなど
Gemini ProのAPIリリース開始
It’s time for developers and enterprises to build with Gemini Pro – Dec 13, 2023:The Keyword | Google
(開発者と企業がGemini Proを使用して構築するときが来ました)
DeepMind社のGeminiの紹介ページ
Gemini | DeepMind – Google
*ChatGPTとGemini Ultraとのベンチマーク比較などがあります
Gemini API のスタートガイド
ドキュメント:Gemini API のスタートガイド – Generative AI Studio API | Google AI for Developers
各Geminiの概要
✔︎ Gemini Ultra:
非常に複雑なタスクに対応する、Google社の最も有能かつ最大のモデル。
✔︎ Gemini Pro:
幅広いタスクに拡張するための最適なモデル。
今回は、Gemini Pro(テキスト情報のプロンプトに対応)・Gemini Pro Vision(画像のみの入力や、「画像+テキスト情報のプロンプト」に対応)のAPIがリリースされています。
✔︎ Gemini Nano:
オンデバイスタスク向けの最も効率的なモデル。
目まぐるしい変化・・・AI業界。Geminiを使ってみたい!
最近ようやくチャットAIを触り始めましたが、その中でも
・Gemini(ジェミニ)
というGoogleのAIモデルがこの記事初回投稿時点の2023年12月15日では、世界的なトレンドのようです。
ただ、こういった先端技術を扱うには、経験上
・(多少の…)プログラミングの知識が必要
となります。
自分自身も
「 Gemini Pro APIというものを使いたいけど、どうやったら使えるの?」
というレベルですので、国内外の情報を(夜な夜な)調べて、翌日の仕事に(いつか…)支障が出るのではないかと心配しています…
実のところ、今日は早く寝る予定でしたが、Gemini Proを気軽に使えるようにしたいという思い湧き出てきてしまったので、夜中にGoogle Colaboratoryの無料枠でGeminiを気軽に楽しめるようにするための、日本人の方向けのチュートリアルコードの作成に没頭してしまいました…
今後公開予定のチュートリアルが、AI初学者の日本人の方が、最新AI技術に触れるきっかけになることがありましたら幸いです。
お楽しみに♪
【公開開始】日本人向けのGemini Pro API活用のチュートリアル
・チュートリアルコード:(2023年12月16日公開開始)
Gemini-Pro&Vision-for-Japanese-AI-Beginners.ipynb(The MIT License)| Google Colaboratory
・チュートリアル動画:(2023年12月17日公開開始)
【現代の魔法】Gemini Proの使い方入門:マルチモーダルAIの世界 – Gemini API Tutorial for AI Beginners by RehabC – デジタルで、遊ぶ。(YouTube動画)
・チュートリアル記事:(2023年12月16日公開開始)
日本人のためのGemini Pro・Gemini Pro Visionの使い方:マルチモーダル型生成AIモデル
by 子供プログラマー
気軽にチャットAIが始められるおすすめの拡張機能です。会員登録やログイン不要で使えるチャットAIもあります。
:【使い方】ChatHub入門 – チャットAIをはじめよう