Inteligência artificial detecta estrelas da Via Láctea que se formaram em outra galáxia
Muitos astrônomos passam toda a carreira sem encontrar um novo objeto no céu. Mas Lina Necib, ainda estudante de pós-doutorado em física teórica no Instituto de Tecnologia da Califórnia (Caltech), já conseguiu descobrir uma série de estrelas que pertencem à Via Láctea, mas que não nasceram nela, graças a uma combinação de recursos que incluiu supercomputadores, o observatório espacial Gaia, e novos métodos de aprendizagem profunda para inteligência artificial.
Num artigo publicado em Nature Astronomy essa semana, Necib e seus colaboradores relatam a descoberta de Nyx, uma vasta corrente estelar nas proximidades do Sol que pode fornecer a primeira indicação de que, no passado, uma galáxia anã se fundiu com o disco da Via Láctea. Acredita-se que essas correntes estelares são aglomerados globulares ou galáxias anãs que foram “esticadas” por forças gravitacionais ao longo de sua órbita antes de se romperem por completo.
++ LEIA MAIS
Regularidade de pulsos de ondas de rádio de altíssima energia vindos do espaço intriga astrônomos
Na corrida para voltar a Lua, astrônomos querem leis para assegurar espaço para pesquisa
A descoberta de Nyx seguiu uma rota tortuosa, que reflete as vias complexas e multifacetadas da pesquisa em astronomia e a astrofísica de hoje em dia.
Desde 2014, pesquisadores da Caltech, da Universidade de Northwestern e da Universidade da Califórnia, dentre outras instituições, vêm desenvolvendo simulações altamente realísticas e detalhadas de galáxias como parte de um projeto chamado FIRE . Essas simulações incluem tudo que os cientistas sabem sobre formação e evolução de galáxias. Tendo como ponto de partida o equivalente virtual ao início dos tempos, a simulação produz galáxias que parecem e agem muito como a nossa.
Mapeando a Via Láctea
Em paralelo ao projeto FIRe, em 2013 a Agência Espacial Europeia lançou o observatório espacial Gaia. Seu objetivo era criar um mapa tridimensional extraordinariamente preciso de cerca de um bilhão de estrelas, da Via Láctea e além.
“É o maior estudo deste tipo até hoje. O observatório fornece a movimentação de um bilhão de estrelas. Um subconjunto delas, com sete milhões, possuem velocidades “3D”, o que significa que nós podemos saber exatamente onde a estrela está e como é sua movimentação”, diz Necib. Esta avalanche de dados está permitindo aos cientistas obter uma nova compreensão da estrutura da Via Láctea.
Para descobrir Nyx, foi preciso combinar dados dos projetos FIRE e Gaia e analisá-los utilizando métodos de aprendizagem profunda, uma das facetas da inteligência artifical.
“Galáxias se formam engolindo outras galáxias”, diz Necib. “Consideramos que a Via Láctea possui um histórico de fusões, e por um tempo ficávamos intrigados com sua atual placidez porque nossas simulações mostram muitas fusões. Agora, que podemos observar muitas estruturas menores, estamos entendendo que ela não esteve tão quieta como nos parecia. Realmente estamos ainda começando a entender como se deu a formação da Via Láctea.”
Aplicando aprendizagem profunda à Gaia
Um mapa com bilhões de estrelas possui informações demais para ser processado apenas pela mente humana. “Não podemos encarar sete milhões de estrelas e entender o que elas estão fazendo. O que nós fizemos nessa série de projetos foi utilizar um falso catálogo de Gaia”.
Os falsos catálogos de Gaia, desenvolvidos por Robyn Sanderson (Universidade da Pennsylvania), buscavam responder uma questão : se as galáxias simuladas através do FIRE fossem reais, e pudessem ser observadas através do Gaia, o que poderíamos ver?
O colaborador de Necib, Bryan Ostdiek (antigamente da Universidade de Oregon, hoje da Universidade de Harvard), que anteriormente esteve envolvido no projeto do Grande Colisor de Hádrons (LHC), tinha experiência lidando com grandes conjuntos de dados utilizando aprendizagem profunda e aprendizagem de máquina. O emprego desses métodos na astrofísica abriu as portas para uma nova via de exploração do cosmos.
“As galáxias geradas pelo projeto FIRE fornecem um ambiente maravilhoso para treinar nossos modelos, mas não são a Via Láctea. Nós tivemos de aprender não apenas o que poderia nos ajudar a identificar as estrelas interessantes na simulação, mas também como generalizar isso para nossa galáxia real”, disse Ostdiek.
A equipe desenvolveu um método de localizar os movimentos de cada estrela nas galáxias virtuais e a rotular cada estrela como tendo nascido na galáxia hospedeira ou oriunda de uma fusão entre galáxias. Os dois tipos de estrelas possuem assinaturas diferentes, apesar de as diferenças em geral serem sutis. Esses rótulos foram utilizados para treinar o modelo de aprendizagem profunda, que foi então testado em outras simulações do FIRE.
Após terem construído o catálogo de teste, eles usaram o programa para analisar os dados do Gaia. “Nós perguntamos a rede neural, ‘baseado no que aprendeu, você pode rotular se as estrelas vieram de fora ou não?’”, disse Necib.
O modelo classificou sua certeza quanto a origem exterior de uma estrela usando notas entre 0 e 1. A equipe criou uma margem para tolerância de erro e começou a explorar os resultados.
Essa abordagem, onde um modelo é treinado com um conjunto de dados e depois é usado para analisar outro grupos de dados diferentes, porém relacionados, é chamada de transferência de aprendizagem, e pode ser cheia de desafios.
O modelo conseguiu identifica uma aglomeração de 250 estrelas, que estão em rotação junto com o disco da Via Láctea, mas também estão se movendo em direção ao centro da galáxia. “A primeira reação foi pensar que era um erro de programação”, diz Necib. Após três semanas ela se convenceu de que não era um bug e sim algo novo.
O projeto necessitou de computação avançada em diferentes estágios. A simulação FIRE e sua atualização, FIRE-2, estão entre os maiores modelos computacionais já criados. Cada uma das nove simulações principais — são três formações distintas de galáxias, cada uma um pouco diferente — exigiu meses para ser computada pelos maiores e mais rápidos supercomputadores do mundo. Isso incluiu o Blue Waters, no Centro Nacional para Aplicações de Supercomputadores (NCSA), as instalações High-End da Nasa e mais recentemente o Stampede2 no Centro de Computação Avançada do Texas (TACC),
Os pesquisadores utilizaram clusters de computadores da Universidade de Oregon para treinar o modelo de aprendizagem profunda, e para aplicá-lo a grande quantidade de dados do Gaia. Atualmente eles continuam os estudos utilizando o Frontera, o sistema mais rápido disponível nas universidades do globo. “Tudo sobre esse projeto é computacionalmente muito intenso, e não seria possível de acontecer sem computação de alto nível”, disse Necib.
Próximos passos
Necib e sua equipe planejam explorar Nyx utilizando telescópios no solo. Isso fornecerá informação sobre a composição química da corrente, e outros detalhes que irão ajudá-los a datar a chegada de Nyx na Via Láctea, e possivelmente fornecer pistas sobre de onde veio.
O próximo lançamento de dados de Gaia em 2021 irá conter informações adicionais sobre 100 milhões de estrelas no catálogo, tornando mais provável a descoberta de novas aglomerações adicionais.
“Quando a missão Gaia começou, os astrônomos sabiam que era um dos maiores conjuntos de dados que eles iriam conseguir, com muito para ficar empolgado”, disse Necib. “Mas nós precisávamos evoluir nossas técnicas para adaptar o conjunto de dados. Se nós não mudarmos ou atualizarmos nossos métodos, nós estaríamos perdendo a física que está em nossos conjuntos de dados”.
O sucesso da abordagem da equipe do Caltech pode ter um impacto ainda maior. “Nós estamos desenvolvendo ferramentas computacionais que irão estar disponíveis para muitas áreas de pesquisa e para coisas não relacionadas a pesquisa também”, ela disse. “Isso é como nós empurramos a fronteira tecnológica no geral”.
Universidade do Texas, Austin, Centro de Computação Avançada Texas
Publicado em
08/07/2020