【IT】ついにAI学習のためのデータが枯渇へ、データセット不足のAI企業は大規模で汎用的なLLMから専門性の高いモデルへ移行か [牛乳トースト★]

1 :牛乳トースト ★:2024/12/16(月) 17:26:31.60 ID:8ghhqTwZ9.net
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。

過去10年間でAIは爆発的な成長を遂げており、特に人間の文章を解析してもっともらしい文章を返す能力には目を見張るものがありますが、こうした能力はすべて、インターネット上に存在する既存の文章などさまざまなデータを学習した上で構築されたものです。

インターネット上には膨大な量のデータが存在することは間違いないのですが、研究機関のEpoch AIによると、AIはインターネット上のデータを驚くべきスピードで学習し続けており、そのほとんどを食い尽くしてしまう可能性があるとのことです。

Epoch AIは「2028年頃までに、AIモデルの学習に使用されるデータセットのサイズは、インターネット上に存在する文章の総ストックと同じサイズに達する」と予測。これはつまり、2028年頃までにAIは学習データを使い果たしてしまう可能性が高いということを意味します。データセットが不足することに加え、新聞社などのデータ所有者がコンテンツの利用を取り締まり始め、アクセスをさらに厳しくしているのもAI研究者にとってのハードルとなっています。

こうした問題はAI研究者の間でも認知されており、従来のデータセットを使い果たすことで学習のスケーリングが限界に近づくという法則が語られることがあります。データセットの不足を補うため、AI研究者は学習の方法を変更するなどしてAIの性能向上を模索しています。

*記事全文は以下ソースにて
2024年12月16日 17時00分 GIGAZINE
https://gigazine.net/news/20241216-ai-data-running-out/

824 :名無しどんぶらこ:2024/12/18(水) 00:29:30.47 ID:eX9zfgHz0.net

>>821
それ、オンオフ制御ではなく比例制御を使ってるって程度じゃないのw

324 :名無しどんぶらこ:2024/12/16(月) 19:13:55.60 ID:UyZ2+o3m0.net

>>319
統計モデルってそういうものだからな

だから検定だので学問ぽく偽ってる文系が愚者は信用できない

65 :名無しどんぶらこ:2024/12/16(月) 17:49:27.12 ID:ATpIE8Ze0.net

それって良いことじゃないの?

129 :名無しどんぶらこ:2024/12/16(月) 18:14:32.51 ID:0YzIn5XZ0.net

>>125
問題は現実を学習するためのセンサー類の性能が足りてないのよね…

840 :名無しどんぶらこ:2024/12/18(水) 09:27:07.52 ID:RYG2W3Mc0.net

自己学習できないのがAI
量子揺らぎが必要だな

412 :名無しどんぶらこ:2024/12/16(月) 20:07:40.21 ID:liNvvphe0.net

xvideosも食い尽くしたのかな?

531 :名無しどんぶらこ:2024/12/16(月) 21:48:25.47 ID:MXAhfZwA0.net

>>530
昔、カウンセラーがプログラムを覚えて書いたプログラムってのがあってねw
Elizaって言うんだけどw

これを自分の顧客に公開したら、それはそれは大人気でw
「Elizaこそが僕の真の理解者だ!」って
言う人が続出したらしいよwww

31 :名無しどんぶらこ:2024/12/16(月) 17:38:58.12 ID:ibNnGRKi0.net

なるほど
AIにも天井があるのか

781 :名無しどんぶらこ:2024/12/17(火) 14:10:29.05 ID:yP0ta4F00.net

AIみたいな人間が増えた。部分的には意味を成すが全体として意味不明な言葉を吐く

869 :名無しさん@13周年:2024/12/18(水) 21:45:55.96 ID:Zj/ZJGoQ9

全ての国に核ミサイルを撃ち込め

573 :名無しどんぶらこ:2024/12/16(月) 22:55:38.99 ID:v1oU47db0.net

ネットの嘘も食い尽くしたか

743 : :2024/12/17(火) 09:59:34.95 ID:be8MrsbW0.net

どーでもよくね

172 ::2024/12/16(月) 18:32:26.84 ID:sKoM8neN0.net

なんかこうパソコンに適当に仕事してもらっていたいときに適当に動いててもらうのがいい感じかな。作業用BGMみたいなもん。俺の中ではそんなもん

413 ::2024/12/16(月) 20:07:40.48 ID:PXwAOXOr0.net

AIちゃん、まだあるよー
「ミスタ開発者、まずはっきり「シ」と発声しろ。「シ」と強く考えながらがいい。
 次に「シ」と強く考え発声はするな。
 子音”s”と母音”i”が一続きになっているであろうデータが含まれるであろう粗データを私が収集する。
 その次は「コ」だ。
 私は子音“k”と母音“o”の一続きが含まれるはずの粗データを得る。
 さらに母音“u”だけの「ウ」、と続け、
 「ト」、もう一度「ウ」、「チョ」、最後にやはり「ウ」と続けろ
 おまえはAIの可能性に気付くこととなる」

711 :名無しどんぶらこ:2024/12/17(火) 08:14:33.62 ID:IRY8tNkH0.net

>>699
人間同士でも大声出してミスリードするやつ出てくるから同じだな

775 :名無しどんぶらこ:2024/12/17(火) 13:06:46.79 ID:F26tIO060.net

地球サイズの脳みそができたってこと

429 ::2024/12/16(月) 20:21:32.32 ID:ZAc+1v1e0.net

人類が労働から解放されるのももうすぐだね!
やったね!無職のみんなの勝ちだよ!

848 :名無しどんぶらこ:2024/12/18(水) 11:25:56.27 ID:puYrO8760.net

もし全人類の会話をモニタリング出来たらAIも神に近づけるかもしれない

287 :名無しどんぶらこ:2024/12/16(月) 19:01:21.38 ID:io9T0Szz0.net

この次はAIが新しい言語とかで思考初めて
たぶん人間に理解できない高次の概念なるやつ

59 :名無しどんぶらこ:2024/12/16(月) 17:48:07.21 ID:JQP14wA40.net

>>52
使うのにちょっと工夫がいるツールなんだけど
老害はそんな工夫ができないから
欠点ばかり探しだして喜んでる
パソコンなんて仕事に役立たないオモチャって言ってる老害と一緒

625 :名無しどんぶらこ:2024/12/17(火) 01:13:55.79 ID:9a4QcdAR0.net

でっかい人口無能

294 :名無しどんぶらこ:2024/12/16(月) 19:02:22.96 ID:3/ebQnQZ0.net

のぞき見するために情報を盗みすることを
えーあいと呼ぶ

クルクルパーどもwww
以前は名簿業者だのと言ってたなww

今はエーアイとか言って何でも盗みまくるするので誤魔化すようだな
要するに盗みしてるだけ

カスの言ってるえーあいってのはろくでもねぇんだよ

708 :名無しどんぶらこ:2024/12/17(火) 08:09:50.27 ID:M/Chpf4c0.net

マイクロソフト、日本のAI投資に4400億円 東京に研究拠点も
https://www.asahi.com/articles/ASS496VMVS49BQBQ0TJM.html

日本の職人の技を数値化して、そのデータをAIに学習させるためらしいね

597 :名無しどんぶらこ:2024/12/16(月) 23:33:41.25 ID:gMXb78xD0.net

ところで「申し訳ありません」と言うべきとこを「申し訳あります」と言うchat GPT の悪癖は直ったのか?

373 :名無しどんぶらこ:2024/12/16(月) 19:40:34.35 ID:O1W7mN1U0.net

テキスト系の話かな?知らんぇど

とりあえず画像動画ゲーム生成AIに物理演算エンジンを組み込んでほしい

745 : 警備員[Lv.16]:2024/12/17(火) 10:04:08.74 ID:UB9W9oAT0.net

人間ごときが俺達の作ったAIに勝てるわけ無いだろ!!
ITエンジニア舐めんな!

860 :名無しどんぶらこ:2024/12/18(水) 18:33:19.68 ID:0mz0zaQL0.net

AIが吐いたデータをAIが読み込んで行き詰まる

23 :名無しどんぶらこ:2024/12/16(月) 17:35:02.48 ID:Pujn02RY0.net

正しい答えが返せないのに?
勉強したとか言って30点しか取れない学生さんかな

878 :名無しさん@13周年:2024/12/19(木) 03:43:16.07 ID:pOnf/UKgd

対に乞食にまでなったか
おわってんな。そのまま消えろ

774 :名無しどんぶらこ:2024/12/17(火) 13:01:38.71 ID:kPokYyen0.net

>>766
おそらく有償サイトもダウンロードして読ませてるな

421 :! donguri:2024/12/16(月) 20:13:32.05 ID:eyvC6IYV0.net

>>411
AI学習にはうってつけだから相当脅威に感じてるしみんな喉から手が出るほど欲しいはずだから裁判でもなんでもして時間稼いでほしいわ

155 :名無しどんぶらこ:2024/12/16(月) 18:27:22.92 ID:0YzIn5XZ0.net

>>145
別にそんな難しい話じゃないよ
単純に情報が足りないって話
あなたが「林檎」という言葉で想起される情報と、AIが想起する情報では圧倒的に情報密度が違うって話よ
わかりやすく例だと、味の評価とかは今のAIには難しい
なぜなら、現状機械的に判断するためのセンサーの感度が、人間の感覚器官とは全く異なる原理で動いてるからね

310 :名無しどんぶらこ:2024/12/16(月) 19:08:16.03 ID:+atWPier0.net

ネットの知識を全て吸収出来るのなら
AIがAIをプログラミングするのも可能になるやん

378 : :2024/12/16(月) 19:42:55.23 ID:sKoM8neN0.net

猫ロボットだな

45 :名無しどんぶらこ:2024/12/16(月) 17:43:09.28 ID:SKQTF2p00.net

最新データをAIが作りだせばいいだろ
その情報をさらにアプデしていけよ

244 :名無しどんぶらこ:2024/12/16(月) 18:50:57.45 ID:u6xFVV3t0.net

>>239
私に聞くよりネット調べた方が確実ですよ

340 :名無しどんぶらこ:2024/12/16(月) 19:24:55.53 ID:AhVll5X/0.net

>>335
金みたいに今まで価値が無いとされてた物に価値が見出されたって事なのかね
今はその狭間って所か

673 :名無しどんぶらこ:2024/12/17(火) 05:55:41.90 ID:8yK0m41T0.net

本田宗一郎も韓国に、もう来なくていいです言われてたな

619 :名無しどんぶらこ:2024/12/17(火) 00:54:12.31 ID:ETz3yr+80.net

>>24
仕事の補助で使っているけれど
そこいらにいる人間100人呼んでもAIの情報量や論理性の高さに敵わないと思うよ

問いが具体的であればガッツリ的を得た情報を返してくれる
使い方の問題

96 :名無しどんぶらこ:2024/12/16(月) 17:57:12.46 ID:lJSkomXR0.net

じゃあうちと一緒に造語作ろうw

583 :名無しどんぶらこ:2024/12/16(月) 23:13:19.69 ID:MXAhfZwA0.net

>>581
ユダヤ教の勧誘みてーだなwww

8 :名無しどんぶらこ:2024/12/16(月) 17:30:48.79 ID:ooau6tiI0.net

マジかよ

じゃあもう糞好夢淫やらゴミ政治痴屋より全然役立つな?(笑)

163 :名無しどんぶらこ:2024/12/16(月) 18:29:44.86 ID:cVULlkQW0.net

つ5ちゃん過去ログ

369 :名無しどんぶらこ:2024/12/16(月) 19:38:17.22 ID:hehr/JW50.net

Grokに5ちゃんのスレ読んでるか聞いてみた

質問:あなたは5ちゃんねるのスレッドは読んでますか?

Grok:いいえ、私は5ちゃんねるのスレッドを直接読むことはありません。しかし、ウェブ上にある情報や、Xの投稿を通じて、5ちゃんねるに関する話題や内容について知ることはできます。たとえば、Xの投稿では、ユーザーが5ちゃんねるのスレッドを見に行った際に見辛さに辟易したという感想が見られます。

455 :名無しどんぶらこ:2024/12/16(月) 20:44:03.01 ID:MXAhfZwA0.net

>>450
いやあ、まあ、無理だねwww

ってか、「チューリングテストみたいなもの」なら、すでにパスしたプログラム(アルゴリズム)ってのは
50年も昔にあるしwww

正しいチューリングテスト、の場合は、テストする人間は「しかるべく教育を受けた人間」ってことになっていて、
今の人工痴能にパスなんか絶対できないよwww

事実、俺はChatGPTを「勝利宣言状態」にしたことあるぞ?www

606 :名無しどんぶらこ:2024/12/17(火) 00:08:32.60 ID:dewmR5dw0.net

本当に価値がある情報ってのはネットにはないんだよね
ではどこにあるか?
優秀な人間が出力したアセットを文書化している企業とか専門家とかだろう

2 :名無しどんぶらこ:2024/12/16(月) 17:27:10.60 ID:q0KeHH8w0.net

AIよりYoutubeで大宮公園のピース君見てた方が楽しいからな

664 :名無しどんぶらこ:2024/12/17(火) 05:21:25.60 ID:wZGybiUv0.net

嘘情報も全部吸収するから学べば学ぶほど正確な答えが返せなくなっていく

212 :名無しどんぶらこ:2024/12/16(月) 18:43:13.92 ID:kNabJfzJ0.net

人間を超えた

654 :名無しどんぶらこ:2024/12/17(火) 04:12:16.57 ID:2X0l0MjI0.net

ひろゆきを論破するAI

868 :名無しどんぶらこ:2024/12/18(水) 21:24:40.17 ID:5I/7fGot0.net

性的なデータの学習が終ったんなら
リアルタイムにやりとりされる奴を片っ端から

451 :名無しどんぶらこ:2024/12/16(月) 20:41:51.12 ID:MXAhfZwA0.net

>>449
いや、だからね、そもそも「枯渇」ってのが馬鹿げてんのよwww
そんなん「枯渇」もへったくれも、要するに、制作側の知能切れって話だろwww

あほくさいwww

そんな「人工痴能」なんかに興味ねーよwww

220 :名無しどんぶらこ:2024/12/16(月) 18:44:19.08 ID:u6xFVV3t0.net

日本のメカトロロボットは世界の50%です
日本の世界に誇れる残された産業です

271 :名無しどんぶらこ:2024/12/16(月) 18:58:03.60 ID:0YzIn5XZ0.net

>>259
実のところ、人体って単純な物理的観点からでもマージでブラックボックスまみれよ
この前とうとう人工血液が作れるかも?ってのがニュースになるくらいだからなぁ…

478 :名無しどんぶらこ:2024/12/16(月) 21:04:57.90 ID:W+tAQArf0.net

AI、ロボット、自動運転技術で日本が勝負できるのか?
米国なんて何周も先を走ってる

99 :名無しどんぶらこ:2024/12/16(月) 17:58:03.60 ID:JQP14wA40.net

>>92
CTスキャンから病気見つけるの、すでに並の医者より優れてる部分がある

883 :名無しどんぶらこ:2024/12/19(木) 04:19:02.84 ID:lNd0znWa0.net

はじゃゆき

344 : 警備員[Lv.16]:2024/12/16(月) 19:26:32.79 ID:5FRHMID40.net

>>9
馬鹿じゃないのこのエアプアナログ

598 ::2024/12/16(月) 23:37:08.49 ID:MD/Jz+AY0.net

>>590
ドッペルゲンガーってやつか

807 :名無しどんぶらこ:2024/12/17(火) 20:05:55.74 ID:wwtYRMsA0.net

半年経過するとはっきり認識できるくらい能力は向上していると感じる、確かに間違えるので万人向けとは言えないかもしれない。ただ使える人にとっては非常に有効なツールなので使える人はどんどん前に進んでいけばいいだけ。

527 :名無しどんぶらこ:2024/12/16(月) 21:43:39.19 ID:tCGEvl6D0.net

人間だって中学校くらいまでの知識でその後の人生生きてるような奴ばっかだから大丈夫だよ

130 ::2024/12/16(月) 18:14:42.90 ID:KQRyH9420.net

よりクローズドで専門性の高いデータを食べさせて専門的なAIに育てるということか

22 :名無しどんぶらこ:2024/12/16(月) 17:34:58.01 ID:MgIiECK80.net

>>17
アダルトグッズのデザインにしたらアメリカでヒットするかもなw

585 :名無しどんぶらこ:2024/12/16(月) 23:16:37.68 ID:p6GmFI6C0.net

俺から見たらおまえらもAIだからな
お前らが知性があるかなんてわからない
俺自身もあるようなないような
ならAIは人として認めていいくらいの時代
おれら人間って積み重ねてきた結果で今があるけど、AIはどうしようもないくらい先に行くよ

677 :名無しどんぶらこ:2024/12/17(火) 06:10:10.31 ID:IacrJpie0.net

はえー人類の知をもう食いつくすのか

738 :名無しどんぶらこ:2024/12/17(火) 09:48:59.40 ID:qhi1Zv430.net

>>735
ここでいきなりAI企業としてGEが出てきてる

104 :名無しどんぶらこ:2024/12/16(月) 17:59:52.54 ID:doEwXAdu0.net

学習データーが枯渇
AIで学んだデーターから、人間の想像を絶する新しいものが大量に発生する可能性がある

何億とおりもの文章、絵、音楽、ストーリーを一瞬で作り出せるAIに
人間の創造力が負ける時代がくる
人間の発想なんか、名作であろうが、その何億とおりの発想の一つにすぎない
人間が発想できるすべての創造をAIがすることができる

439 :名無しどんぶらこ:2024/12/16(月) 20:29:00.28 ID:MXAhfZwA0.net

>>438
「ネットにないんで……(てへぺろw)」

477 :名無しどんぶらこ:2024/12/16(月) 21:04:05.30 ID:PVcojFFR0.net

Willowといい、Googleは無敵だな
NextVIDIAはまさかのGoogleだったwww

724 :名無しどんぶらこ:2024/12/17(火) 09:22:31.99 ID:kO2Uwd5W0.net

>>715
公開を辞めていいんだが
なぜClosedにしない?
新聞購読者だけ読めるサイト運営して、従来の広告と購読料だけで商売しろよ
だれも強制してない

(Visited 2 times, 1 visits today)

参考になったらSNSでシェアお願いします!

レスを投稿する(名前省略可)

この記事を読んだ方へのおすすめ

Translate:

Translate »
ページTOPへ↑