Posts for: #BERT

拡散言語モデルのLLaDA

2025-06-30

BERTを拡張した生成モデル？拡散型LLM「LLaDA」の概要と可能性

2025年に入り、拡散モデルを用いた大規模言語モデル（LLM）が注目されています.特に「Gemini Diffusion」や「LLaDA（Large Language Diffusion with mAsking）」といった新しいアプローチは、従来の自己回帰型（autoregressive）モデルとは異なる性質を持ち、今後のLLMのあり方を変える可能性すらあります. 提案手法のLLaDAとLLaMAを比較したものが以下で、提案手法は遜色ない性能が出ています.

[Read more]

貧乏人なのでPoor Man’s BERTを読んで解説

2020-06-21

#BERT #DeepLearning #自然言語 #蒸留 #高速化 #Transformer #深層学習

本記事はQrunchからの転載です。

最近自然言語処理をよくやっていて、BERTを使うことも多いです。 BERTの性能は高く素晴らしいのですが、実際使う上では、私のような計算リソース弱者には辛いところがあります。

[Read more]

画像と自然言語でのマルチモーダルなImageBERT

2020-02-24

#ImageBERT #BERT #ディープラーニング #画像 #自然言語 #キャプショニング画像と自然言語でのマルチモーダルなImageBERT

本記事はQrunchからの転載です。

最近Microsoftから発表されたImageBERTについて紹介します。
ImageBERTはBERTの入力に自然言語だけではなく、画像も受け付けるようにしたマルチモーダルなモデルです。また論文ではモデルのアーキテクチャだけではなく、学習方法にも新たな提案がされています。
実験ではImage-to-Sentenceでの検索とSentence-to-Imageの検索タスクでSOTAが示されています。

[Read more]