Ru-RSTreebank. Русскоязычный дискурсивный корпус.
На этом сайте размещен Ru-RSTreebank – корпус текстов на русском языке, размеченных в рамках Теории риторической структуры, разработанной в 1980-е годы У.Манном и С.Томпсон.
Узнать больше:
Корпус предназначен для исследователей, заинтересованных в изучении письменного дискурса. Корпус позволяет проводить различные эксперименты по автоматическому анализу текста с привлечением данных о дискурсивных связях внутри него.
Возможные области применения: генерация текстов, извлечение фактов, автоматическое реферирование, разрешение анафоры и выявление кореферентных цепочек и т.д.
Объем корпуса: 333 текстов, около 328 000 словоупотреблений.
Жанр текстов: новостные тексты, научно-популярные тексты, научные статьи и тексты блогов.
Просим при цитировании или упоминании материалов проекта ссылаться следующим образом: