Em alguns casos, para que um visitante consiga acessar determinada página na internet, é preciso digitar um código. Trata-se do captcha. Eles são utilizados para descobrir se os acessos estão sendo feitos por pessoas ou por robôs.

Captcha é a sigla para Completely Automated Public Turing test to tell Computers and Humans Apart. Na tradução: Teste de Turing público completamente automatizado para diferenciação entre computadores e humanos.

Ele é utilizado como uma solução antispam. Para isso, solicita aos visitantes de um site que insiram um código exibido em uma mensagem distorcida, geralmente com letras e números, para comprovar que se trata de um ser humano, em vez de um bot e, assim, dar continuidade ao acesso.

Na área do judiciário, quem precisa ler muitos processos, a cada um, necessita digitar os códigos exibidos. Para auxiliar os profissionais, o estatístico Julio Trecenti desenvolveu um aplicativo capaz de ler os processos públicos do judiciário sem passar pela trava do captcha. Os resultados foram apresentados em sua tese de doutorado, concluída no IME-USP sob orientação do Prof. Dr. Victor Fossaluza.

Julio Trecenti é bacharel em Estatística, com mestrado e doutorado pelo IME-USP. Foi conselheiro e presidente do CONRE-3, além de conselheiro do CONFE. É sócio-fundador da ABJ, a Associação Brasileira de Jurimetria e da Curso-R, empresa de cursos de programação em R e consultoria em ciência de dados.

“O meu interesse nos dados do judiciário foi bastante incidental. Eu não tinha muito interesse pelo Direito, no início. Mas no segundo ano de faculdade tive a oportunidade de trabalhar com o Marcelo Guedes, a pessoa que trouxe a jurimetria para o Brasil. Quem fez a conexão foi o professor Adilson Simonis, do IME-USP. Essas pessoas influenciaram fortemente minhas decisões de carreira. Depois, eu fiquei bastante interessado na temática dos dados abertos do judiciário, o que é até hoje o motivo principal de trabalhar nessa área”, explica.

Na Associação Brasileira de Jurimetria (ABJ), Julio precisou acessar dados do judiciário, que são públicos, mas não são abertos. Foi assim que aprendeu a utilizar técnicas de raspagem de dados para conseguir executar as pesquisas. E nesse contexto aparecem os Captchas, que bloqueiam o acesso automatizado a esses dados públicos. Conversando com amigos, como Daniel Falbel e Athos Damiani, e os professores Rafael Stern e Rafael Izbicki, descobriu que era possível utilizar modelos estatísticos para resolver os Captchas. E aí, mesmo com algumas ressalvas, a pesquisa começou a se desenvolver.

“Eu não imaginava que acabaria trabalhando com Captchas no doutorado. Eu achava o tema muito polêmico para o meio acadêmico e tinha medo das pessoas acharem que eu era mal intencionado, ou ainda me processar! Quem me convenceu a desenvolver os Captchas no doutorado foi o amigo Fernando Correa, que colocou racionalidade nos meus devaneios. Só depois, eu vi que o tema realmente era interessante e que a resolução de Captchas é algo desejável para pesquisa”, comenta.

Para seu trabalho, Julio Trecenti utilizou conhecimentos em matemática, estatística e computação e explica cada uma das áreas.

“Para resolver captchas, geralmente utilizamos um modelo chamado de redes neurais. A rede neural pode ser pensada como um modelo de regressão que aprendemos na estatística, mas com uma arquitetura um pouco mais elaborada. Entender como o modelo funciona do ponto de vista estatístico foi essencial para propor a técnica que desenvolvi no doutorado, que envolve uma modificação na função de perda (que na estatística seria a verossimilhança). A matemática é importante para a estatística pois é por lá que a estatística se desenvolve. E a computação é importante tanto para implementar os algoritmos estatísticos, quanto para extrair e arrumar as bases de dados enormes que usamos no judiciário”, diz.

 

Estatística no Direito

Julio Trecenti explica que a estatística aplicada ao direito pode trazer benefícios porque analisar dados do judiciário ajuda muito a entender como as coisas funcionam na prática.

“Os dados podem ser utilizados para melhorar estratégias jurídicas do judiciário. As empresas analisam dados de seus processos para fazer análises de risco. Operadores do judiciário fazem jurimetria para melhorar a administração dos tribunais. O legislativo utiliza jurimetria para fazer análise de impacto regulatório e propor melhores leis. Com um judiciário mais transparente, a população em geral pode utilizar dados e pesquisas para tomar melhores decisões quando se relacionam com a justiça”.

 

Estatística e tecnologia

Não há como negar a presença da tecnologia, em especial a Inteligência Artificial, machine learning e deep learning na área de dados. Neste sentido, fica claro que, quem deseja estar neste mercado, também precisa conhecer estatística.

“Nós interagimos diariamente com ferramentas de IA (nos buscadores, ao escrever um e-mail ou ao receber uma propaganda), mas essas coisas ficam um pouco “escondidas” para o usuário final. No entanto, nos últimos anos, estamos cada vez mais entrando em um universo onde as ferramentas de inteligência estão disponíveis para todo mundo. Isso significa que, em breve, o mercado exigirá que as pessoas sejam usuárias de IA, independentemente de sua área de trabalho. Mas ser uma pessoa que usa IA é bem diferente de ser uma pessoa que desenvolve técnicas de IA. E para desenvolver ou validar novas técnicas, é necessário conhecer estatística”, explica.

Outro tema atual é o aplicativo ChatGPT. Questionado sobre sua importância no mundo tanto da ciência de dados, quanto da sociedade e se os estatísticos perderão espaço para os profissionais que vão buscar soluções através desse tipo de algoritmo, Julio reforça a necessidade de um olhar diferenciado para a ferramenta.

“Os estatísticos serão usuários (eu já sou!) de ferramentas como o ChatGPT e similares, da mesma forma que jornalistas, médicos e advogados, programadores e professores. Os trabalhos não vão deixar de existir, mas serão modificados. Possivelmente veremos algumas mudanças nas relações de trabalho e também na discussão sobre produtividade. Novas tecnologias não devem ser temidas, devem ser incorporadas e criticadas. O ChatGPT tem um monte de problemas e defeitos, mas é muito útil!”, revela.

Julio afirma que a ferramenta é útil, mas tem algumas limitações e traz a resposta do ChatGPT, que segue abaixo:

Embora aplicativos como o ChatGPT e outros algoritmos de inteligência artificial estejam mudando a maneira como abordamos muitos problemas, é importante lembrar que a ciência de dados é um campo vasto e interdisciplinar. Estatísticos e profissionais que trabalham com algoritmos como o GPT-4 têm habilidades e conhecimentos complementares e, na verdade, podem colaborar de maneiras frutíferas.

Os estatísticos possuem habilidades especializadas em análise de dados, inferência e modelagem, que são fundamentais para muitos aspectos da ciência de dados. A estatística também desempenha um papel crítico no desenvolvimento e avaliação de algoritmos de inteligência artificial, incluindo o GPT-4. Por outro lado, os profissionais que trabalham com algoritmos como o GPT-4 têm habilidades em aprendizado profundo, processamento de linguagem natural e otimização, que são igualmente importantes no campo da ciência de dados. Em vez de estatísticos perderem espaço para profissionais que trabalham com algoritmos de inteligência artificial, é provável que vejamos uma maior colaboração entre esses dois grupos. Haverá um intercâmbio de conhecimentos e habilidades, levando a soluções mais avançadas e abrangentes para os problemas que enfrentamos.

Em resumo, os estatísticos continuarão a desempenhar um papel importante no mundo da ciência de dados. A evolução das tecnologias e algoritmos, como o ChatGPT, provavelmente incentivará uma colaboração mais estreita entre diferentes especialistas na área, em vez de substituir completamente um pelo outro.

 

Dicas de Julio Trecenti para quem deseja saber mais sobre a Estatística

  1. Fortaleça suas habilidades matemáticas: Aproveite seu tempo no ensino fundamental e médio para desenvolver uma base sólida em matemática. Matérias como álgebra, cálculo e probabilidade são fundamentais para o estudo da estatística.
  2. Aprenda a programar: Conhecimentos de programação são altamente benéficos para estatísticos, pois muitas análises são realizadas usando softwares e linguagens de programação específicas. Aprender linguagens como R e Python pode ser um trunfo para sua carreira futura.
  3. Desenvolva habilidades de comunicação: A capacidade de comunicar os resultados de análises estatísticas de forma clara e eficaz é fundamental. Pratique a comunicação oral e escrita para garantir que você possa explicar conceitos complexos de maneira compreensível.
  4. Explore cursos e recursos: Há uma grande quantidade de cursos e recursos disponíveis online para ajudar a aprender estatística e ciência de dados. Aproveite esses recursos e busque oportunidades de aprendizado fora da sala de aula.

Para conhecer a tese, clique aqui

Julio Trecenti, ex-presidente do CONRE-3, desenvolve algoritmo para leitura de captchas no judiciário