Skip to content

ITD - Dataset de Acordãos do STF de 2010 a 2018

Text CorporaPortuguese

The ITD - Dataset de Acordãos do STF de 2010 a 2018 dataset is a Portuguese text corpora resource.

About ITD - Dataset de Acordãos do STF de 2010 a 2018

A base Iudicium Textum Dataset (ITD), contêm os textos extraídos dos Acórdãos do Supremo Tribunal Federal de 2010 a 2018. Os textos estão separados por seção, com os votos e os relatórios identificados por autor (ministro). O texto original também foi mantido de forma integral e as partes envolvidas, em grande parte, estão identificadas. Os dados estão organizados em um arquivo json, podendo ser importado para um banco MongoDB. Junto com a base, estão disponíveis também os arquivos pdfs originais, bem como as ferramentas e os códigos que foram utilizados para download, extração e conversão dos dados que compõem o dataset

Details

Task
Text Corpora
Language
Portuguese
Format
Text
Rows / instances
n/a
Download Paper

Related Text Corpora datasets

FAQ