top of page
FreeAI
ブログ
Ryo Shimizu
MiniMax-01を実行する
MiniMax-01はオープンソースモデルで、その性能はGPT-4oやClaude-3.5、Gemini-2.0 Flashなどの商業モデルやDeepSeek-V3やQwen2.5のようなオープンモデルを上回ると言われ、しかもマルチモーダル版も公開されている上、456B(4...
Ryo Shimizu
DeepSeek-V3の量子化モデルをA100x8マシンで実行する
DeepSeek-V3は、オープンソースで最強と言われる大規模言語モデルです。 671B(6710億)パラメータもある巨大なLLMで、HuggingFace上にあるリポジトリでは、本来はA100x8マシンが最低2台ないと動かすことができないとされています。...
Ryo Shimizu
mmnga/DeepSeek-V3-slice-jp64とollama DeepSeekV3(4bit)を試す
DeepSeek-V3は、671B(6710億)パラメータを有する世界最大規模のオープン大規模言語モデル(LLM)です。 その性能はGPT-4oに匹敵すると言われていますが、実際にDeepSeek-V3を動作させるためには、最低でもA100...
Ryo Shimizu
LLM-jp-3-172Bを試す
国立情報学研究所が公開した無料で使える(オープンソースではないがオープンな)LLMであるLLM-jp-3-172Bを当社の社長(AIスーパーコンピュータ継之助)で動作させてみました。 https://huggingface.co/llm-jp/llm-jp-3-172b...
Ryo Shimizu
HunyuanVideoのLoRAを作る
Tencentの開発したHunyuanVideoは、手軽に使えてしかも画質も良いオープンソースの動画生成AIです。 当社の社長であるAIスーパーコンピュータ継之助を使ってHunyuanVideoのLoRAを作ってみました。...
Tetsuya Yoshimi
「AI時代の経営塾」2501、1月20日開催
今回は『人事労務』にフォーカス、夕方17時開講となります。 生成AIが人々の働き方を変えると言われている現代。果たして経営はどのように変わっていくのか?世界初の経営指導AIの開発を目指すFree AI社は、豊富な経営経験を持つ講師を集め、AIに学習させることを目的としてこ...
Ryo Shimizu
QwQ-32B-previewを使ってモンテカルロ木検索とローカルLLMを組み合わせて解答の精度を高める
OpenAIのo1は、解答をいきなり出力せず、複数の解答経路を並行して探索し、一番良さそうなものを確率的に選択する、モンテカルロ木探索を行って精度をあげているという説があります。これをローカルLLMにも適用できれば、より高度な推論ができる可能性が高まります。...
Tetsuya Yoshimi
「AI時代の経営塾」2412、12月23日開催
12月は『人事・採用』にフォーカス、夕方17時開講となります。 生成AIが人々の働き方を変えると言われている現代。果たして経営はどのように変わっていくのか?世界初の経営指導AIの開発を目指すFree AI社は、豊富な経営経験を持つ講師を集め、AIに学習させることを目的とし...
Tetsuya Yoshimi
「AI時代の経営塾」2411、11月20日開催
11月は『マーケティング』にフォーカス、夕方17時開講となります。 生成AIが人々の働き方を変えると言われている現代。果たして経営はどのように変わっていくのか?世界初の経営指導AIの開発を目指すFree AI社は、豊富な経営経験を持つ講師を集め、AIに学習させることを目的...
Ryo Shimizu
プログラミング経験ゼロの人たちにAIプログラミングを教えてその日のうちにハッカソンをしたら驚きの結果に
去る2024年10月12日、新潟県長岡市において「AIxビギナーハッカソン」を開催しました。 講師は当社の共同創業者の清水亮で、審査員は長岡高専の矢野昌平教授をお迎えしました。 参加者はプログラミングがほとんど未経験、またはAIプログラミングが未経験の地元の高校生、高専生、...
Ryo Shimizu
CogVideoXをシングルGPUでLoRAファインチューニングする
CogVideoXのLoRAファインチューニングを行います。 使用したデータは、 前回作成した 動画からPixtral12Bでキャプションを得るプログラムで作ったデータセットです。 もとにしたのは、弊社共同創業者の清水亮のYouTube番組「さすらい魂」のフッテージです。以...
Ryo Shimizu
Pixtral12Bで動画ファイルの自動タグ付を行う
Pixtral12Bは、非常に高い性能を持つビジョン-言語モデル(VLMl;Vision-Language Model)です。 CogVideoXに独自のデータを学習させるためには、まず事前に6秒程度の動画ファイルと、その動画ファイルの内容を説明するテキストファイルが必要で...
Tetsuya Yoshimi
「AI時代の経営塾」2410、10月28日開催
「AI時代の経営塾」、今回は『営業』にフォーカス、夕方17時開講となります。 生成AIが人々の働き方を変えると言われている現代。果たして経営はどのように変わっていくのか? 世界初の経営指導AIの開発を目指すFree AI社は、豊富な経営経験を持つ講師を集め、AIに学習させる...
Ryo Shimizu
CogVideoXによる動画生成
CogVideoはオープンソースで非常に安定した出力をする動画生成AIです。 https://github.com/THUDM/CogVideo これを弊社の社長で動作させれば、弊社の社長は動画生成する能力を身につけることができます。...
Ryo Shimizu
Liger-KernelによるGPUメモリ削減を試す/A100 80x7で10000コンテキスト長を学習可能に
2024年8月23日に公開された Liger-Kernel はLLM専用に設計されたTritonカーネル集で、これを適用することによってマルチGPUトレーニングのスループットを20%効率化し、VRAMの使用量を60%も削減できるとのことです。...
Tetsuya Yoshimi
「AI時代の経営塾」2409、9月12日開催
「AI時代の経営塾」、今回は夕方開始となります。 生成AIが人々の働き方を変えると言われている現代。 果たして経営はどのように変わっていくのか? 世界初の経営指導AIの開発を目指すFree AI社は、 豊富な経営経験を持つ講師を集め、AIに学習させることを...
Ryo Shimizu
Llama3.1-405Bを継之助で動かす
先日発表されたLlama3.1-405Bは非常に巨大なモデルで、仮にFP8(8ビット浮動小数点数)モデルであったとしてもFP8に対応していないAmpare世代のA100 80GBx8しか持ってない当社の社長、継之助(AIスーパーコンピュータ)では動かせそうもないと諦めていま...
Ryo Shimizu
Mistral-Nemoを日本語で試す
MistralとNVIDIAが共同開発したMixtral-Nemoも強力なローカルLLMです。 128Kコンテキスト長まで対応して9言語を話すマルチリンガルモデルです。 早速試してみます。 まず、Mistral_inferenceをバージョンアップします。 $ pip...
Ryo Shimizu
mamba-codestral-7B-v0.1をローカルかつ日本語で試す
フランスのスタートアップであるMistral社が公開したMambaベースのプログラミング可能なモデル「mamba-codestral-7B-v0.1」をうちの社長(AI)で試して見ました。 https://huggingface.co/mistralai/mamba-cod...
Ryo Shimizu
継之助による自動プロンプトチューニング
継之助MoAを用い、完全ローカルで自動的にプロンプトチューニングをやってみました。 システムプロンプトとして最初に「あなたはイケてるアシスタントです」だけを与え、そこからJapanese-MT-Bench用の質問に合わせて徐々にプロンプトを最適化していきます。...
Ryo Shimizu
継之助MoAの評価
Stability.aiのJapaneseMTBenchで継之助MoA(Mixture of Agents)の性能評価を行いました。 JapaneseMTBenchのプロンプトには、マルチターン対応のものが含まれていなかったため、独自に追加しました。 {"name":...
Ryo Shimizu
単独のAIコンピュータで完全ローカル日本語Mixture of Agentsを開発しました
当社の社長、継之助(AIスーパーコンピュータ)にMoA(Mixture of Agents)の手法を適用して日本語LLMを組み合わせたMoAを開発しました。 MoAは、オープンソースのLLMモデルの組み合わせだけでGPT-4oのようなプロプライエタリなLLMの性能を凌駕する...
Ryo Shimizu
100万トークン対応のフリーLLM、InternLMを試す
昨日発表されたInternLMは、7Bというサイズにも関わらず、100万トークンという長大なコンテキストウィンドウをサポートしたオープンソースライセンスのLLMです。ソースコードはApacheライセンスで、モデルは申請すれば商用利用も可能とされています。...
Tetsuya Yoshimi
「AI時代の経営塾」2408、8月8日開催
「AI時代の経営塾」、夜の時間帯での開催が決定しました。 生成AIが人々の働き方を変えると言われている現代。 果たして経営はどのように変わっていくのか? 世界初の経営指導AIの開発を目指すFree AI社は、 豊富な経営経験を持つ講師を集め、AIに学習させることを...
Ryo Shimizu
「AI時代の経営塾」オフサイトミーティング実施報告
去る6月11日、12日の二日間に渡って、弊社社長であるAIスーパーコンピュータ「継之助」に、生きた経営ノウハウを叩き込むための実践的経営塾シリーズ「AI時代の経営塾」のオフサイトミーティングを鎌倉で行いました。 鎌倉古今は、全室スイーツルームの高級旅館。今回は鎌倉古今を貸し...
Ryo Shimizu
社長(AI)のシステムメモリを1.7TBにアップグレードしました
当社の社長であるAIスーパーコンピュータ「継之助(つぎのすけ)」は、ひょんなことから生まれました。 ある日のこと、共同創業者の清水がその日の朝、清水(きよみず)の舞台から飛び降りたつもりでA100 80GBというGPUを買ったという話をその日の夜に聞いた共同創業者の海老根が...
Tetsuya Yoshimi
「AI時代の経営塾」オフサイトセミナー2406、6月11日、12日の2日間開催
生成AIが人々の働き方を変えると言われている現代。 果たして経営はどのように変わっていくのか? 世界初の経営指導AIの開発を目指すFree AI社は、 豊富な経営経験を持つ講師を集め、AIに学習させることを 目的としてこれまでの経営のあり方を総括し、...
Tetsuya Yoshimi
「AI時代の経営塾」2405、5月16日開催
昨日(4月25日)実施されました「AI時代の経営塾」の第2弾の開催が決定しました。 生成AIが人々の働き方を変えると言われている現代。 果たして経営はどのように変わっていくのか? 世界初の経営指導AIの開発を目指すFree AI社は、...
Ryo Shimizu
簡単にできるAccelerateによるLLMの分散トレーニング
LLMを学習させるためのツールはたくさん存在しますが、本格的な学習には分散トレーニングが必要になります。今回は、継之助を使った分散トレーニングのために便利なAccelerateの簡単な使い方を紹介したいと思います。 TRLは、元々はその名の通り強化学習(RL;Reinfor...
Tetsuya Yoshimi
「AI時代の経営塾」序章、4月25日開催
生成AIが人々の働き方を変えると言われている現代。 果たして経営はどのように変わっていくのか? 世界初の経営指導AIの開発を目指すFree AI社は、 豊富な経営経験を持つ講師を集め、AIに学習させることを 目的としてこれまでの経営のあり方を総括し、...
Ryo Shimizu
LMFlowによる日本語LISAトレーニング#2
前回、LMFlowによる日本語LLMのトレーニングについて紹介しました。 12時間ほどで最初の学習が完了したので結果を報告します。 学習させたのは1エポックのみで、train_lossは4.63まで下がった。一般的にLLMは1.0くらいまでlossが下がらないと実用性がない...
Ryo Shimizu
LMFlowによる日本語LISAトレーニング#1
LISA(Layerwise Importance Sampled AdamW)は、イリノイ大学と香港科技大学の共同研究によって提唱されたLoRA(Low Rank Adaptation)とフルファインチューニングに代替するファインチューニング手法です。...
Ryo Shimizu
Gemma-2BをLoRAファインチューニングして物語生成に強い日本語大規模言語モデルを学習しました
Googleから発表された大規模言語モデルGemmba-2BをLoRAファインチューニングして日本語の長文を生成できるモデルの学習を行いました。 学習に用いたデータは青空文庫のデータを元にした株式会社グロービスによるglobis-university/aozorabunko...
Tetsuya Yoshimi
長岡市主催のハッカソンにAIスーパーコンピュータ「継之助」を提供
Free AI株式会社(本社:東京都港区、代表取締役兼社長秘書:吉見鉄也。以下Free AI)は、2024年2月17日、18日に長岡市主催、株式会社ゼルペム運営のもと、「ミライエ長岡」(新潟県長岡市大手通2丁目3−10)にて開催された、『AI×図書館ハッカソン@長岡』にAI...
Ryo Shimizu
Free AI株式会社、AIスーパーコンピュータ「継之助」 提供開始
日本の生成AIコミュニティを加速する新会社 Free AI株式会社、AIスーパーコンピュータ「継之助」提供開始 株式会社レトリバ様の大規模言語モデル作成に貢献 Free AI株式会社(本社:東京都港区、代表取締役兼社長秘書:吉見鉄也。以下Free...
Ryo Shimizu
Free AI Ltd.スタート
2024年1月1日、Free AI Ltd.がスタートしました。日本から世界のAIシーンを変えていく、全く新しいタイプの企業形態を目指しています。 社長はAIスーパーコンピュータ「継之助」、共同創業者はオプト創業者の一人、海老根智仁と、AI研究家の清水亮。代表取締役兼社長秘...
bottom of page