O
Vocabulário Ortográfico Comum da Língua Portuguesa (VOC) é muito mais do que uma lista de palavras, ou do que um grande banco das palavras da língua, a que se aplicam as regras decorrentes de uma ortografia, neste caso, as da nova ortografia comum.
Em primeiro lugar, o VOC é um instrumento comum para a política da língua, construído pelos países que tem o português como língua oficial. Ele positiva, desta forma, o ideal da CPLP de uma língua comum, comum não só no seu uso, mas também na sua produção, isto é, na gestação dos recursos que garantem usos cada vez mais diversificados, nos novos ambientes do ensino digital e de outras novas tecnologias.
Em segundo lugar, o VOC é uma base de dados digital disponível gratuita e universalmente para os cidadãos, acessível pela Internet, com aproximadamente 250 mil entradas e mais de dois milhões de formas ortográficas, realizada segundo os últimos avanços da lexicografia, composto por um vocabulário etiquetado que permite saber, entre outras coisas, o uso atestado de cada uma das palavras em cada país, possibilitando visualizar que palavras são comuns a todos os países e que palavras ocorrem em que país ou países especificamente.
Pela sua natureza multifuncional e pelos desdobramentos que gera, o VOC é um importante insumo para a criação da futura geração de terminologias técnicas e científicas, conforme o espírito do Acordo Ortográfico da Língua Portuguesa de 1990.
O processo de construção do VOC foi dividido em duas partes. A primeira parte, que permitiu criar o protótipo desta plataforma, entregue na
Conferência de Lisboa de 2013, consiste na junção ou unificação dos vocabulários ortográficos nacionais (VON) do Brasil e de Portugal produzidos nos últimos anos. Essa primeira parte configura uma verdadeira
Memória Lexicográfica do Português, conformada pela junção do léxico das bases de dados de Portugal e do Brasil num instrumento único, feito com critérios e etiquetas comuns.
Idealmente, no entanto, o VOC deve VON para os vários países que aplicam o Acordo Ortográfico, pelo que importa em vários casos construir de raiz, pela primeira vez, um vocabulário próprio, seguindo no entanto uma metodologia comum. Esse trabalho está em curso em vários estados-membros e o VOC, nesta primeira versão, integra já, de forma inédita, os primeiros dados de Moçambique e de Timor-Leste. Os VON estão a ser executados seguindo critérios comuns de fiabilidade em termos da origem dos textos a servirem como corpus de extração, seguindo os mesmos procedimentos de compilação e conformando corpora de dimensões comparáveis em termos de número de entradas.
A segunda parte do VOC, desenvolvida a partir do modelo aqui apresentado, será entregue na Cimeira de Chefes de Estado da CPLP, a realizar em Díli em 2014, e integrará os VON prontos à data, previsivelmente seis, com a adição aos quatro agora integrados dos VON de Cabo Verde e de São Tomé e Príncipe, em fase adiantada de execução.
Com o VOC, a Língua Portuguesa passará a contar com um instrumento totalmente novo e com uma gestão inovadora e democrática do léxico da língua, com a humildade de reconhecer que, em pesquisa e desenvolvimento, somos, a cada geração, sempre, anões montados nas costas de gigantes.