コーパスに基づく言語研究。コーパスとはテキストや発話を記録し、集積したもの。特に英語研究では1980年代からコンピューターを利用した巨大なコーパスがいくつか構築され、この分野が急速に発展した。現在、世界最大のコーパスはイギリスのコリンズ出版社とバーミンガム大学とが共同開発したThe Bank of English(英語銀行)と呼ばれるもので、総語数2億語を集積している。さらに、同所のアーカイブには書きことばと話しことばの両方が含まれている5億語が集積されている。このような資料は、言語研究のさまざまな目的に利用され、なかでも語法分析や辞書編集に有益である。日本では、国立国語研究所が「書き言葉コーパス」の構築を進めており、2010年までに1億語の集積を目指す。