Добрый день,
Могу ли я использовать корпус для определения частоты сочетания согласных в русском языке (например, как часто употребляется "тр" в начале слова) ?
Спасибо
Анна
Здравствуйте!
Сочетания букв специально не размечены, поэтому систематический поиск любых сочетаний в любой позиции невозможен.
Возможно следующее.
1) Сочетания согласных в начале и в конце слова, используя звездочку: тр* и *тр или "*тр" - в последнем случае будут выдаваться словоформы, оканчивающиеся на тр (театр, но не театра).
2) В Мультимедийном корпусе размечены гласные и согласные, нужно воспользоваться на странице http://ruscorpora.ru/search-murco.html опцией Орфоэпическая структура. Выбирать можно любые сочетания согласных, но выдаваться будут в разных позициях - и в начале слова и в середине, и в конце.
Также можно использовать вокалическую структуру слова и искать в односложных, двусложных и т.д. словах.