Algoritmo e Jornalismo?
O New York Times é uma escola de jornalismo de excelência. Eles usam algoritmos no editorial faz tempo. Lembro de ter assistido à palestra deles no SXSW sobre isso há pelo menos 10 anos. Obviamente, eram outros tempos. Agora, eles usam as novas versões de GenAI, a Inteligência Artificial Generativa que tanto sucesso está fazendo com o ChatGPT-4 e outros concorrentes.
Eles abriram transparentemente tudo que fazem para recomendar conteúdos editoriais com base em um complexo composto de premissas que, por sua vez, orientam seus algoritmos.
Fiz abaixo um resumo do que eles mesmos contam, em primeira voz, como fazem. Mas tem muito mais no link lááá embaixo, que leva a um artigão detalhado sobre o processo completo.
Como o NYT orienta seu algoritmo: resumo técnico
“A programação algorítmica compreende três etapas: (1) Pooling: Criar um conjunto de histórias elegíveis para um módulo específico; (2) Ranking: Classificar as histórias por meio de um mecanismo de ranqueamento; e (3) Finalização: Aplicar diretrizes editoriais e regras de negócios para garantir que o resultado final das histórias atenda aos nossos padrões. O julgamento editorial é incorporado em todas essas etapas, de diferentes maneiras.
Para fazer uma recomendação algorítmica, primeiro precisamos de um conjunto de artigos elegíveis para aparecer em um determinado módulo da página inicial. Esse conjunto pode ser manualmente selecionado pelos editores ou gerado automaticamente por meio de uma consulta com base em regras definidas pela redação.
O conjunto geralmente inclui mais histórias do que o número de espaços disponíveis no módulo, então precisamos de um mecanismo para classificá-las e determinar quais exibir primeiro e em que ordem. Embora existam várias maneiras de classificar as histórias, o algoritmo que frequentemente usamos na página inicial é o “contextual bandit”, um método de aprendizado por reforço (consulte nosso blog anterior para mais informações).
Em sua forma mais simples, um bandit recomenda o mesmo conjunto de artigos envolventes para todos os usuários; a versão ‘contextual’ usa informações adicionais dos leitores (por exemplo, histórico de leitura ou localização geográfica) para ajustar as recomendações e tornar a experiência mais relevante para cada leitor. Para um exemplo de bandit geopersonalizado, veja aqui.
Para priorizar histórias relevantes e com impacto, usamos várias abordagens para quantificar a importância editorial. Uma abordagem é fazer com que os editores atribuam uma classificação a cada história no conjunto, com histórias mais recentes e de maior relevância geralmente sendo consideradas mais importantes.
Outro método infere a importância de uma história com base em sua promoção anterior na página inicial, onde histórias que permanecem em posições de destaque por mais tempo são classificadas como mais importantes. Independentemente da abordagem, a importância editorial pode ser combinada com o bandit para garantir que o julgamento editorial seja incorporado ao processo de ranqueamento, priorizando assim as histórias consideradas importantes pela redação.
Depois de termos uma lista classificada de histórias, fazemos ajustes finais com base em regras predefinidas desenvolvidas em parceria com a redação antes que as histórias sejam exibidas aos leitores.
Uma dessas intervenções é a função de ‘fixação’, que permite que os editores substituam o algoritmo e fixem histórias importantes no topo. Outros exemplos importantes são os filtros ‘já lidos’ e ‘já vistos’, que despriorizam histórias que o usuário já leu ou viu um certo número de vezes.
Esta etapa final de acabamento garante que o julgamento editorial molde o resultado final e que mantenhamos uma experiência dinâmica e renovada para o usuário.”
Fonte: https://www.niemanlab.org/2024/10/how-the-new-york-times-incorporates-editorial-judgment-in-algorithms-to-curate-its-home-page/
O New York Times demonstra uma abordagem híbrida ao combinar julgamento editorial e algoritmos avançados, como o aprendizado por reforço, para entregar recomendações personalizadas aos seus leitores. Esse modelo de curadoria segue um fluxo em três etapas — seleção, ranqueamento e finalização —, onde as preferências da redação e a importância editorial são integradas ao processo automatizado. O uso de GenAI e técnicas como o “contextual bandit” permite que as recomendações sejam ajustadas com base nos dados dos usuários, mantendo a relevância e garantindo uma experiência personalizada.
Além disso, o jornal preserva sua identidade editorial ao permitir que os editores intervenham diretamente no algoritmo, priorizando manualmente histórias relevantes quando necessário. Essa integração entre tecnologia e julgamento humano assegura uma curadoria dinâmica e atualizada, oferecendo uma página inicial equilibrada entre as preferências dos leitores e a missão jornalística do veículo. Assim, o NYT exemplifica como a inteligência artificial pode ser utilizada de maneira transparente e ética para aprimorar o jornalismo, sem perder de vista o valor da tomada de decisão editorial.