IA em física de partículas: Jhoão Arneiro, doutorando do HEPIC estuda IA para identificar a estrutura de jatos de partículas

Jhoão Arneiro é pós-graduando do Instituto de Física de São Paulo sob orientação do professor Alexandre Suaide. Doutorando do grupo HEPIC, ele busca identificar a estrutura de jatos de partículas, resultantes de colisões de prótons. Atualmente, ele trabalha especificamente na classificação de jatos através de imagens com o uso de redes neurais convolucionais, um tipo de Inteligência Artificial (IA).

 

O professor Alexandre Suaide tem grande interesse em tecnologias de Machine Learning*, desenvolvimento de IAs de um modo geral e tem procurado integrar isso com análises em física de partículas. Juntamente com outros docentes, criaram uma matéria de IA aplicada em física, como uma das disciplinas da pós-graduação. O trabalho atual de Jhoão surgiu de  um projeto da disciplina que pretendia fazer o chamado “tagging”, uma forma de identificar (rotular) dados, usando Inteligência Artificial (IA). 

 

*A aprendizagem de máquina ou Machine Learning, é um campo de estudo em inteligência artificial que desenvolve algoritmos estatísticos que de certa forma aprendam a executar tarefas por meio de dados e generalizá-los para demais

 

Esses jatos são resultantes de colisões que ocorrem dentro de grandes aceleradores de partículas como no LHC do CERN. Nesse caso, quando uma partícula colide em outra, ela é decomposta em partículas menores, formando uma estrutura colimada, que é chamada de jato. 

 

Imagem:Um evento monojato registrado pelo experimento ATLAS em 2017, com um único jato de momento transverso. As barras verdes e amarelas mostram os depósitos de energia. (Imagem: Colaboração ATLAS/CERN)

https://atlas.cern/updates/briefing/precision-search-dark-matter


 

Os jatos de partículas usualmente são estudados fazendo uso de algoritmos de seleção e definição de Jatos, os dados dos jatos são medidos nos detectores de partículas e estudados para determinar propriedades de quarks originais. 

(http://www.sbpcnet.org.br/livro/69ra/resumos/resumos/2079_134c447f50d42ef3ce22b5437726defdc.pdf)

 

A Inteligência Artificial (IA) é um tipo de tecnologia em que se tenta reproduzir um processo semelhante ao raciocínio humano. Ao desenvolver máquinas que realizam funções complexas de forma autônoma, os cientistas buscam com esse tipo de sistema, analisar uma quantidade grande de informações e com isso obter resultados que seriam impossíveis com outros métodos. 

 

Identificar os jatos de partículas do LHC não é um trabalho simples, e a ideia geral de seu projeto de doutorado é criar uma IA, ou rede neural, que possibilite a identificação de estruturas dos jatos de partículas sem utilizar algoritmos de reconstrução de jatos . 

 

Inicialmente, são realizadas simulações de colisões entre prótons em um programa que está disponível para a comunidade de física de altas energias, onde há um grande controle do tipo de evento de interesse. Jhoão utilizou  6 milhões de eventos que podem ser separados em 4 tipos: 1,5 milhão de eventos que produzem pares de beauty  e anti beauty ; 1,5 milhão de eventos com quarks  charm e anti-charm; 1,5 milhão de eventos com apenas quarks leves, que incluem o strange, up, down e glúons; e por fim, 1,5 milhão de eventos com partículas de fundo (que não formam as estruturas de jatos).

 

Imagem: Ilustração do procedimento de conversão da posição das partículas em um detector para a imagem do evento. Imagem: Indicado pelas setas, temos o ponto de colisão, abaixo o feixe de prótons e na área superior as partículas que que saem e são transformadas na imagem do quadro inferior direito.


 

Os eventos simulados  possibilitam a criação de imagens das partículas resultantes do processo de colisão. A rede é treinada com dados simulados pois são bem conhecidos , para que ao final do processo, ela esteja apta para ser aplicada em situações em que não há o entendimento da situação inicial.

 

“O primeiro resultado que foi muito interessante, é que, com a aplicação das redes neurais, é possível identificar estruturas com os dados de simulação. Isso se reflete em uma divisão muito bem distinta dos dados de fundo, dos dados que possuem o evento, podendo assim, coletar dados de jatos ocorridos.”

 

Os dados do movimento dessas partículas, ângulo e rapidez delas, juntamente com dados da carga da partícula, podem ser transformados em diferentes cores** que podem ser representados em gráficos. 

 

Imagem: Gráficos de eventos - Imagem de um único evento decomposto em 5 canais de cor, sendo estes  pT, carga elétrica, mais 3 canais associados aos números bariônico, mesônico e leptônico das partículas. 


 

**A diferenciação das cores é utilizada para usar a técnicas relacionadas ao Computer Vision: Área da computação que busca algo parecido como a visão humana, ao treinar computadores para processar e interpretar imagens ou informações visuais.

 

Essas imagens são passadas para a rede neural, a Inteligência Artificial desenvolvida no trabalho, para identificar as estruturas dos jatos. Com os dados presentes na imagem, é possível associar informações que são passadas pixel a pixel, e a rede neural faz o trabalho de ligar informações como se fossem pistas para desvendar o mistério de qual o evento que originou essas partículas com maior ou menor probabilidade. 

 

Esses padrões são identificados pela rede, como parâmetros, dados numéricos, passando pelas imagens em convolução e depois são passadas as informações pixel a pixel em redes neurais conectadas. Finalmente, são analisadas as classes de cada partícula, por meio dos dados de probabilidade encontrados pela rede.

 

Esse tipo de IA é chamado de rede neural convolucional, ele é usado em outros sistemas para identificar números ou letras escritas à mão, ou até mesmo para identificar um animal em uma foto. Na essência, se baseia em observar imagens iniciais, associar os dados da imagem recebida com os dados que já foram treinados, para que a IA forneça probabilidades de identificar padrões.

 

Imagem: Esquemático de funcionamento da rede neural convolucional. A imagem é inserida para ser analisada, ela passa pelas convoluções, onde a rede neural atua analisando pixel a pixel da imagem com dados já analisados e treinados anteriormente. Por meio desses dados, é possível classificar essa imagem por meio de probabilidades.

 

Ao final dessa etapa, o resultado dado pela IA, como o de maior probabilidade do evento inicial, é comparado com as informações vindas da simulação . Se o evento com maior probabilidade identificado pela IA é diferente do utilizado na simulação , os parâmetros da rede precisam ser reajustados para que a rede identifique melhor que evento resultou no jato analisado. Esse processo é feito ao longo de todas as imagens criadas treinando a rede de forma contínua, até se obter  resultados condizentes.

 

Sendo validada nesta etapa, a rede é testada com outra amostra de dados, que não foram utilizados no seu treinamento. Ao comparar com o resultado final, sabe-se quão precisa está a rede neural.

 

Imagem 7: A topologia da rede neural convolucional usada, que explica o que tem e como faz cada camada da rede.

 

 

“Distinguir jatos entre si era mais difícil do que a separação dos dados de fundo. Essa distinção era feita por meio dos dados das partículas mais energéticas, que têm maior tendência de serem resultantes desse processo.”

 

Durante o processo de desenvolvimento de pesquisa, conclui-se que  muitas possibilidades podem ser  exploradas. Assim, nesse novo passo da pesquisa, o doutorando aumentou o número de partículas analisadas, adicionando efeitos de fundo, para abrir um leque de maiores possibilidades de eventos de interesse.

 

Uma grade com diversos tipos de eventos, todos apenas no canal de pT. As colunas dividem os eventos entre as nossas 4 classes de interesse. Já na primeira linha, nós temos a média de todos os eventos, seguido por três eventos individuais nas linhas subsequentes. As imagens das médias são particularmente interessantes porque nelas é possível observar não só uma estrutura de jato ao redor da partícula mais energética, como também atrás dela (em phi_relativo = +/- pi), nós vemos uma outra estrutura que se assemelha a um dijato.

 

“Por meio dessas simulações é possível criar imagens dos eventos, usando as propriedades  dessas partículas, como momento e velocidade. Com isso é possível criar um mapa, que seria algo parecido com a imagem de um detector. Podendo assim, escolher a dimensão dos dados e abrangência de interesse”.

 

Jhoão já apresentou trabalho na Quark Matter (QM2025), juntamente com outros membros do HEPIC. O evento é a maior conferência da área de Íons Pesados Relativísticos e esta edição foi realizada em Frankfurt, na Alemanha, onde ele apresentou um poster com resultados parcias de sua pesquisa sobre estudo de jatos com Machine Learning. No evento, Jhoão pode conhecer diversos projetos na área e compartilhar os resultados do seu trabalho.

 

“A Quark Matter foi meu primeiro evento internacional e foi muito legal... Ela é uma conferência muito grande e é para os mais diversos trabalhos em colisões ultrarelativísticas núcleo-núcleo, contando com mais de mil participantes, tendo uma gama muito ampla de assunto dentre os trabalhos apresentados, sendo eles teóricos, fenomenológicos, experitmentais, enfim, de tudo um pouco.”

Por outro lado, tendo esse mundaréu de gente, eu acabei conhecendo muita gente e até fazendo amizade com alguns, o que foi muito massa. A gente até saiu pra beber em uns dois dias e agora são contatos que eu espero poder encontrar novamente em outras situações (seja em outras conferências, em uma colaboração ou em uma viagem qualquer que fosse).

 

Imagem: Quark Matter 2025

 

“Também participei da ML4Jets, que é bem menor e focado em machine learning e jatos. Aprendi muita coisa e pude ter uma visão mais clara sobre o tipo de trabalho que está sendo feito na área atualmente, até dando um direcionamento melhor sobre o que eu faço agora.

 

Desenvolvido por HEPIC IFUSP