1. 耳で学ぶAI、ロボシンク
  2. #24 AnthropicがClaude 3.5 So..
2024-06-26 20:13

#24 AnthropicがClaude 3.5 Sonnetをリリース!ところでアーティファクトって何ですか?👀

【内容】

- Claude 3.5 Sonnetの特徴

- 文章生成の品質をGPT-4oと比較

- 文章校正の精度をGPT-4oと比較

- Artifactsってなに?

- 今後のClaudeファミリーのリリース予定


---

生成AIのニュースレターを始めました🎉 AIの最新情報や知見を効率よくキャッチアップできます。

登録はこちらから→⁠⁠⁠⁠https://bit.ly/3Cq9LDG⁠⁠⁠⁠

---


「耳で学ぶAI、ロボシンク」ではChatGPTなどのAIを初心者向けに分かりやすく解説します。

---

👨‍💻パーソナリティ

矢野哲平

「AIを分かりやすく、楽しく」をコンセプトにポッドキャストやnoteでAI情報を発信。株式会社root c代表取締役。福岡出身。


◎note

https://bit.ly/3LvtP91


◎X: 矢野哲平

https://bit.ly/3Tx6maM

---

【リソース】

◎Claude公式サイト

https://claude.ai

---

◎番組の感想や要望はこちら

https://forms.gle/VMyVYWzHSNKZFu787

Summary

アンソロピックは、Claude 3.5 Sonnetをリリースし、アーティファクトの機能も発表しています。 アンソロピックからリリースされたクロード3.5ソネットは、GPT-4Oよりも高い性能を誇っており、新機能のアーティファクトでは回答結果を視覚的に表示することができます。

アンソロピックの新モデルClaude 3.5 Sonnet
みなさんこんにちは、ロボシンクの矢野です。このポッドキャストは、耳で学ぶAIをコンセプトに、初心者向けにAIを分かりやすく解説する番組です。
今回のテーマは、アンソロピックがClaude 3.5 Sonnetをリリース、ところでアーティファクトって何ですか、について話していきます。
はい、ということで今日は、新しく発表されたClaude 3.5 Sonnetについて話していきたいと思います。
みなさん、Claude 3.5 Sonnet使ってみましたでしょうか。
6月の21日、先週の金曜あたりに、アンソロピックからClaude 3.5 Sonnetという新しい言語モデルのバージョンが発表されました。
今回のエピソードでは、この最新ニュースを交えてClaude 3.5について話していきたいと思います。
今日話すポイントは主に3つです。
1つ目に、Claude 3.5 Sonnetについて。
2つ目に、実際に私の方でClaude 3.5を試したレビュー、使用感について話していきます。
そして最後に3点目、アーティファクトという機能も発表されました。
このアーティファクトについても話していきたいと思います。
はい、では早速話していきたいと思います。
その前にですね、そもそもアンソロピックって何?Claudeって何?と思う人もいるので、軽くちょっとおさらいをさせてください。
アンソロピックっていうのは、オープンAIのような会社ですね。
対話型の生成AI、ChatGPTのようなものを開発している会社となります。
このアンソロピックという会社は、オープンAIとは全く別の会社になります。
ただですね、このアンソロピックという会社は、オープンAIと少なからず関連があるんですね。
というのも、アンソロピックの会社の代表、CEOはですね、もともとオープンAIの上級メンバーだったんですね。
この方がオープンAIを辞めて、設立した会社がアンソロピックというわけですね。
このアンソロピック、実は兄弟で設立した会社になります。
お兄ちゃんのダリオ・アモディさんと妹のダニエラ・アモディさんによって、2021年に設立された会社となります。
すごい兄弟ですよね。
そのアンソロピックが開発する言語モデルが、クロードということになります。
ChatGPTで言うと、GPT-40というのが最新モデルになります。最新の言語モデルですね。
クロードではクロード3が最新モデルでした。
今回クロード3.5ソネットというモデルを公開してきたわけですね。
このモデルっていうのは対話型の生成AI、ChatGPTのようなですね、対話型の生成AIにおけるエンジンのような役割を果たしています。
高性能なモデルほど良い回答結果が得られたり、あとは回答のスピードが速い、などですね。
クロード3.5ソネットのポイントを4つにまとめると、次のようになります。
まず1つ目が、GPT-40を超える性能と言われています。これはアンソロピックが発信している内容ですね。
ChatGPTの最新モデルであるGPT-40を超えましたというわけですね。
2つ目に、クロード3オーパスより2倍速い。
このクロード3オーパスというのは、アンソロピックが公開していた最新モデルですね。
1つ前の最新モデル、それよりも2倍速いと。
3点目、最新モデル、前の最新モデルよりもコストが5分の1というわけです。
そして最後4点目、これが一番個人的には嬉しいと思いました。無料ユーザーでも使える。
以上となります。
どうでしょうか。ChatGPTのGPT-40を超える性能のモデルが無料で使えるっていうのはありがたいですよね。
Claude 3.5 Sonnetの使用感とクロード3.5ソネットの優位性
これが先週リリースされて、早速使ってみたよとSNSに投稿している国内や海外のユーザーですね。多いようです。
私もですね、早速試してみました。
結論先に言うと、いいですね。ちょっとざっくりしすぎなんですけど。
もともとクロードは文章の生成が強いと言われていました。
日本語で文章を作成すると、結構自然な言い回しであったり、違和感のない文章を生成してくれます。
そういったところがですね、クロード3.5ソネットになって、さらに磨きがかかっているような感じがします。
このpodcastロボシンクでも、話している内容っていうのは、ノートに記事を投稿するサイトがあるんですけど、
そのノートにもテキストの記事として投稿したりしています。
具体的には、podcastの台本を生成AIに投げて、記事として成形してもらうと。
成形した内容をノートに記事としてアップロードしているわけですね。
もともとこれは、クロード3のオーパスというモデルを使っていました。
クロードの以前の最上位モデル、最新モデルですね。
それを使っていました。
そこからChatGPTがGPT-4-Oを出してきたので、そっちに乗り換えていたんですね。
今回、クロード3.5のソネットが出てきて比較をしてみました。
これはですね、ものすごい差があるわけではないんですけど、
クロード3.5ソネットの方がいい感じの文章が生成できているように思います。
ちょっと私の主観になるので申し訳ないんですけど、
私の主観では、クロード3.5ソネットの方が言い回しであったり、
文章として読んだ時にですね、読みやすい文章かなと思いました。
その他にも検証をしてみました。
具体的には文章の構成を行いました。
結構ノートで記事を書くようになってから、
生成AIを誤字脱字の発見に使ったりしています。
この検証結果に関して言うと、GPT-4-Oの方が精度が高かったですね。
500文字、1000文字、2000文字でサンプルのテキストを用意して、
各テキストに10個の間違いというのを仕込みました。
これをGPT-4-O、GPT-4、あとはクロード3.5ソネット、
そしてクロード3のシリーズですね。
クロード3オーパス、クロード3ソネット、
あとはついでにGoogleのGemini 1.5 Pro、
あとはGoogle Gemini 1.5 Flashですね。
合計7モデルで、現状を最新と言われている合計7モデルで比較をしてみました。
結果的にはGPT-4-Oが一番精度が良かったですね。
これは誤字脱字の発見をするタスクにおいてですね。
誤字脱字の発見をするタスクにおいては、GPT-4-Oが一番精度が良かったと。
このように、クロード3.5ソネットは全てのタスクにおいてGPT-4を上回っているわけではないと思います。
例えば文章生成で言うと、クロード3.5ソネットの方が良い文章を生成してくれると思います。
ただ、誤字脱字のタスクに関してはGPT-4-Oの方が勝っていると感じました。
このようにですね、それぞれのモデルで得意なこと不得意なことっていうのはあると思うんですね。
なのでそれをこううまく組み合わせる形で使っていくといいのかなと思っています。
ただですね、クロード3のオーバスとソネット、以前のモデルですね。
以前のモデルで誤字脱字のテストをした時って結構スコアが低かったんですよね。
ただ今回クロード3.5ソネットで改めてテストをしてみると、かなり改善されていると感じました。
順番的に言うと、誤字脱字の発見するタスクですね。
それを順番的に言うと、1位がGPT-4-Oでした。
2位がクロード3.5ソネット。
3位がGPT-4という順番でしたね。
誤字脱字を発見するタスクにおいてはこのような順位となりました。
で、こうした高性能なモデルが無料で利用できると。
これはですね、使わない手はないんじゃないでしょうか。
厳密に言うと、使用制限というのがあるので無限に利用できるわけではありません。
たくさん使った場合は何時まで使えませんよと制限はかかります。無料ユーザーですね。
ただこうした高性能なモデルっていうのが無料で使えるっていうのは大きいですよね。
で、このように現在のAIっていうのは非常に速いスピードで新しいモデルが出てきています。
今回もGPT-4-Oが出てどのぐらい経ちました?
GPT-4-Oが出たのが5月13日でした。
それから1ヶ月ちょっとぐらいでライバル企業のアンソロピックが新しいモデルをリリースしてきたわけですね。
それ以外にもGoogleもGeminiという言語モデルを開発しています。
現状国内の市場においてはChatGPTとGeminiとCloudの3つですかね。
これらの企業が月替わりぐらいのペースで新しいサービスであったりモデルをリリースしてくるわけですね。
かなり情報のスピードが速いですよね。
ただ我々ユーザーはですね、自分の業務に活用できるサービスっていうのを粛々と使っていくだけだと思います。
本当にありがたい環境ですよね。
アーティファクトの機能と利用の便利さ
アンソロピックはCloud 3.5 SONETの発表と同時にArtifactという機能も発表しました。
Artifactというとゲームに出てきそうなネーミングをイメージしますが、このArtifactについてちょっと説明しますね。
このArtifactを簡単に言うと回答結果を視覚化できる機能です。
回答結果を視覚的に見えるようにできる機能ですね。
例えば私が生成AIとはというテーマでスライドを作成してと指示をしたとします。
生成AIとはというテーマでスライドを作成してとAIに指示をします。
そうするとCloudの画面の右側に本当にスライドが表示されるんですね。
これはChatGPTにもない機能ですよね。
普通であればスライドの内容を作成してというとテキストでスライドの内容はこうですと表示されていました。
ああいったものが実際に画面の右側にスライドとして表示されると。
しかもそのスライドはめくることもできます。ページを次に進むようなこともできます。
初めてこのArtifactの機能を使った時に何ができるのかよくわからなかったので質問したんですよね。
Artifactの機能を知りたいからなんかサンプル見せてみたいなちょっと雑な感じで指示をしました。
結果帰ってきたのがToDoアプリのサンプルだったわけです。
そのToDoアプリのサンプルっていうのもコードだけじゃなくてもうその画面上で操作できるような結果を返してくれました。
もうそのチャットの画面上でToDoアプリが操作できるんですね。
例えば買い物卵を買う登録をしてそうするとToDoに追加されて、で、ToDoを削除する。
そういった操作がクロードの画面上でできたというわけですね。
これはちょっと驚きましたね。
例えばウェブサイトを作ってとかですね、このデータからグラフを作ってこう指示をすると、画面の右側にその実物が表示されます。
例えばウェブサイトを作ってと指示をすると実際にウェブサイトが表示されます。
Artifactはそうですね、プレビュー機能のような感じですかね。
Artifact、結構ですねインパクトがすごいのでぜひ興味がある方は試してみてください。
このArtifactのインパクトに隠れがちなんですけど、実はもう一つ改善されたものがあります。
それが画像認識ですね。
実はクロード3.5ソネット、画像認識の精度もかなり上がっているんですね。
実はGPT-4Oよりもいくつかのテストで精度が高かったという報告もあります。
これはアンソロピックの発信の内容ですね。
画像の認識精度が上がるっていうのは結構嬉しいことなんですよね。
例えば紙の書類を読み込んでデータとして出力してもらうと、紙の書類を文字起こししてもらうような感覚ですね。
あとは教科書の一部を写真で撮影して、それをクロードに投げて、ここの問題教えてとか、そういった使い方もできます。
レシートの読み取り精度もいい感じですね。
毎回100%の精度っていうわけではないんですけど、手元のレシートだと9割以上はしっかり読み取ってくれます。
この画像認識を使ってAIを使った家計簿システムなんかを作っても面白そうですよね。
最後にアンソロピックという会社の特徴であったり目指しているようなところ、これをですねちょっと話したいと思います。
生成AIの会社と聞くと、結構どこも同じようなイメージっていうのはあると思います。
でも掘り下げると、その企業が何を大事にしているかとか、何を重視しているのかっていうのは結構違ってくるんですね。
例えばアンソロピックで言うと、AIの安全性というものを重視しています。
これはですね、決して他の企業が安全性を軽視している、軽く見ているというわけではありません。
ただアンソロピックは会社の方針として特にAIの安全性というものを重視しています。
その一例がユーザーデータの学習ですよね。
例えばチャットGPTで入力した内容っていうのはAIに学習されます、基本的にはですね。
学習させないようにするには、有料版のチームプランという、それ以上のプランを契約するか、
もしくはAPIというプログラムからチャットGPTを操作するようなものを使う必要があります。
あとはですね、オプトアウトっていう選択肢もあります。
オプトアウトを簡単に言うとですね、チャットGPTに私が入力した内容を学習しないでってリクエストすることですね。
アンソロピックに関しては、デフォルトでユーザーが入力した内容っていうのはモデルの学習に利用されません。
これはもう契約で明記されている内容ですね。
AIのコストやスピード、回答精度っていうのはよく目立つ比較対象ですよね。
どこどこのモデルよりも回答精度が良いとか、コストが安いとか、スピードが速いとか、これはよく目立つ比較対象だと思います。
でもですね、こうした安全性っていうのも見逃せない要素だと思うわけですね。
特に仕事でAIを使う場合は、こういったAIの安全性っていうのも見逃せない重要なポイントだと思います。
どこの会社もですね、この安全性にはしっかり取り組んでいます。
ただその中でも、特にアンソロピックはこうしたAIの安全性っていうのを重要視している企業になります。
今回クロード3.5ソネットのプレスリリースの最後にはこう締めくくられていました。
今年の後半にクロード3.5オーパスとクロード3.5俳句をリリースする予定ですと。
クロードには3つのモデルが存在します。
上からオーパス、ソネット、俳句ですね。
上からオーパス、ソネット、俳句。
それぞれの単語っていうのは歌、詩を意味する単語ですね。
俳句なんかは日本人に親しみが深いですよね。
575の俳句ですね。
クロードの中でも最軽量のモデルという位置づけになります。
今回ちょうど間のモデルソネットがクロード3からクロード3.5に進化したわけです。
そして年内には軽量モデルの俳句と、あとは最上位モデルのオーパスも3から3.5に進化予定ということが触れられています。
特にですね、オーパスっていうのは一番最上位モデルで非常に性能が高いので、
これが3.5に進化するとどのぐらいになるのかっていうのは楽しみですね。
こうしたクロードシリーズを年内に全て3.5に進化させますというわけです。
ただ逆を言うとですね、年内にクロード4のリリースはないかもしれませんね。
年内に3.5をすべてリリースするというふうに言っているので、
年内にクロード4のリリースっていうのはもしかするとないかもしれません。
とはいえ、クロード3.5ソネットとあとはアーティファクトの機能、
これは無料で使えるので気になる方はぜひ試してみてください。
概要欄にリンクを貼っておきます。
もしクロード自体まだ触ったことがないという人でも簡単に登録ができます。
Googleアカウントでも簡単に連携することができます。
使い方もChatGPTとほぼ一緒ですね。
ちょっと画面細かい部分は違うんですけど、ほぼ一緒なので、
使い方に迷うことはないと思います。
チャットにAAへの指示、プロンプトを入力して、あとは回答L、こんな流れですね。
興味のある方はぜひ試してみてください。
最後に今日話したことをまとめたいと思います。
クロード3.5ソネットの発表
1つ目にクロード3.5ソネットという新しいモデルがアンソロピックから発表されたということですね。
2つ目にこのクロード3.5ソネット、GPT-4Oよりも高い性能を誇る。
これはアンソロピックが発信した内容によると、GPT-4Oよりも高い性能を誇ると言われています。
そして3点目、アーティファクトという機能も発表されました。
回答結果を視覚的に表示するというものです。
例えばスライドを作成してというと、視覚的に確認できるスライド資料を表示してくれます。
あとはウェブサイトを作成してというと、そういったですね、ウェブサイトをそのまま画面の中に表示してくれます。
ぜひ興味のある方は試してみてください。
はい、今日はこの辺ということで、本日も聞いていただきありがとうございました。
番組ではこのようにAIの情報を毎週発信しています。ぜひフォローお願いします。
お相手はロボシンクのヤノでした。また次の配信でお会いしましょう。
20:13

Comments

Scroll