Um, dois e três são todos números inteiros, assim como o número negativo quatro. Se você continuar contando para cima ou para baixo, certamente encontrará uma infinidade de números inteiros. No entanto, você não encontrará nada chamado de “infinito positivo” ou “infinito negativo”, pois eles não são considerados números inteiros.
O infinito positivo e negativo não são números inteiros, mas sim símbolos especiais usados para descrever o comportamento dos números inteiros. Às vezes, as pessoas dizem coisas como “5 + infinito = infinito”, porque se você começar com 5 e continuar contando indefinidamente, obterá números crescentes sem um limite. No entanto, não podemos concluir que “infinito — infinito = 5”. Não é possível contar a partir de 0 sem parar e depois contar regressivamente sem parar e, ao final, chegar a 5.
A partir disso, podemos perceber que o infinito não é apenas um não inteiro, mas também não se comporta como um número inteiro. Se você tentar misturar infinito com números inteiros imprudentemente, acabará com comportamentos aparentemente inconsistentes que não são observados nos números reais como 1, 2, 3 e outros.
Mesmo que o infinito não seja um número inteiro, não precisamos nos preocupar em ficar sem números. Embora as pessoas já tenham visto cinco ovelhas, milhões de grãos de areia e septilhões de átomos, ninguém jamais contou uma quantidade infinita de algo. O mesmo vale para quantidades contínuas — as pessoas mediram partículas de poeira com um milímetro de diâmetro, animais com um metro de altura, cidades com quilômetros de extensão e galáxias com milhares de anos-luz de diâmetro, mas ninguém jamais mediu nada com um diâmetro infinito. No mundo real, não precisamos de infinito em grande escala.
Nota para leitores mais sofisticados: Não é necessário me escrever com explicações detalhadas sobre, por exemplo, a diferença entre números ordinais e cardinais. Embora eu esteja familiarizado com várias definições avançadas de conjuntos teóricos infinitos, não vejo uma aplicação útil para eles na teoria da probabilidade.
Na forma convencional de expressar probabilidades, estas estão compreendidas entre 0 e 1. Por exemplo, uma moeda pode ter uma probabilidade de 0,5 de cair em coroa, ou um meteorologista pode atribuir uma probabilidade de 0,9 para chuva amanhã.
No entanto, essa não é a única forma de expressar probabilidades. Por exemplo, é possível transformar probabilidades em chances por meio da fórmula O = (P / (1 – P). Dessa forma, uma probabilidade de 50% seria transformada em chances de 0,5/0,5 ou 1, geralmente representadas como 1:1, enquanto uma probabilidade de 0,9 seria transformada em chances de 0,9/0,1 ou 9, geralmente escritas como 9:1. Para converter chances em probabilidades, utiliza-se a fórmula P = (O / (1 + O)), e essa conversão é perfeitamente reversível, tornando a transformação um isomorfismo — um mapeamento bidirecional reversível. Portanto, probabilidades e chances são isomórficas e pode-se utilizar uma ou outra conforme a conveniência.
Por exemplo, é mais conveniente utilizar probabilidades ao realizar atualizações bayesianas. Suponha que eu lance um dado de seis faces: se qualquer face, exceto o número 1, aparecer, há uma chance de 10% de ouvir um sino, mas se a face 1 aparecer, a chance de ouvir o sino é de 20%. Agora, suponha que eu lance o dado e ouça o sino. Qual é a chance de que o número mostrado seja 1? Bem, as probabilidades iniciais são de 1:5 (correspondendo ao número real 1/5 = 0,20) e a razão de verossimilhança é de 0,2:0,1 (correspondendo ao número real 2). Multiplicando esses dois valores, obtemos as probabilidades posteriores de 2:5 (correspondendo ao número real 2/5 ou 0,40). Em seguida, se eu quiser, posso converter novamente para uma probabilidade, obtendo (0,4/1,4) = 2/7 = ∼29%.
Portanto, as probabilidades são mais manejáveis para atualizações bayesianas — se você utilizar probabilidades, precisará aplicar o Teorema de Bayes em sua forma mais complicada. No entanto, as probabilidades são mais convenientes para responder a perguntas como “Se eu lançar um dado de seis lados, qual é a chance de obter um número de 1 a 4?” Nesse caso, é possível somar as probabilidades de 1/6 para cada lado e obter 4/6, mas não é possível somar as razões de chances de 0,2 para cada lado e obter uma razão de chances de 0,8.
Por que estou compartilhando tudo isso? Para mostrar que as razões de chances são uma forma tão válida de mapear incertezas em números reais quanto as probabilidades. As razões de chances são mais convenientes para certas operações, enquanto as probabilidades são mais convenientes para outras. Um famoso teorema chamado Teorema de Cox (juntamente com suas diversas extensões e refinamentos) demonstra que todas as formas de representar incertezas que obedecem a algumas restrições aparentemente razoáveis são isomórficas entre si. Por que é importante afirmar que as razões de chances são tão legítimas quanto as probabilidades?
As probabilidades, normalmente expressas entre 0 e 1, parecem ser quantidades facilmente compreensíveis — é fácil visualizar 1 zebra ou 0 unicórnios. No entanto, quando você transforma as probabilidades em razões de chances, o valor 0 permanece o mesmo, mas o valor 1 é representado como infinito positivo. Agora, a noção de verdade absoluta não parece tão acessível.
Uma representação que simplifica ainda mais as atualizações bayesianas, é o log odds (ou logaritmo das chances) — é assim que E. T. Jaynes recomendava pensar sobre probabilidades. Por exemplo, suponha que a probabilidade inicial de uma proposição seja 0,0001 — isso corresponde a um log de probabilidades de aproximadamente −40 decibéis. Em seguida, você observa evidências que parecem ser 100 vezes mais prováveis se a proposição for verdadeira em comparação com ser falsa, o que equivale a um acréscimo de 20 decibéis de evidência. Portanto, as probabilidades posteriores ficam em torno de −40 dB + 20 dB = −20 dB, ou seja, a probabilidade posterior é de aproximadamente ∼0,01.
Quando você converte probabilidades em log odds, o valor 0 se transforma em infinito negativo, enquanto o valor 1 se transforma em infinito positivo. Agora, tanto a certeza absoluta quanto a improbabilidade absoluta parecem um pouco mais inatingíveis.
Em probabilidades tradicionais, 0,9999 e 0,99999 parecem estar separados por apenas 0,00009, enquanto 0,502 está muito mais distante de 0,503 do que 0,9999 está de 0,99999. Parece que para chegar da probabilidade 0, 999 à probabilidade 1, você só precisa percorrer uma distância de 0,00001.
No entanto, quando você converte para razão de chances, 0,502 e 0,503 se transformam em 1,008 e 1,012, respectivamente, enquanto 0,9999 e 0,99999 se transformam em 9.999 e 99.999. E quando você converte para log odds, 0,502 e 0,503 se tornam 0,03 decibéis e 0,05 decibéis, mas 0,9999 e 0,99999 se tornam 40 decibéis e 50 decibéis.
Ao trabalhar com probabilidades logarítmicas, a distância entre quaisquer dois níveis de incerteza é igual à quantidade de evidência necessária para passar de um para o outro. Em outras palavras, as probabilidades logarítmicas nos fornecem uma medida natural do espaçamento entre os diferentes graus de confiança.
O uso de probabilidades logarítmicas revela que alcançar a certeza absoluta requer evidências infinitamente fortes, assim como a improbabilidade absoluta requer evidências contrárias infinitamente fortes.
Além disso, os teoremas padrão em probabilidade possuem casos especiais quando você tenta inserir 1s (uns) ou 0s (zeros) neles, como o que acontece ao realizar uma atualização bayesiana em uma observação à qual foi atribuída uma probabilidade de 0.
Portanto, proponho que seja sensato afirmar que 1 e 0 não fazem parte das probabilidades, assim como o infinito negativo e positivo, que não obedecem aos axiomas de campo, não estão presentes nos números reais.
A principal preocupação dos teóricos da probabilidade em relação a essa afirmação é que seria necessário derivar novamente os teoremas obtidos anteriormente, assumindo que podemos obter probabilidades marginais somando todas as partes e igualando-as a 1. No entanto, no mundo real, quando você joga um dado, ele não tem uma certeza infinita de cair em algum número entre 1 e 6. O dado pode ficar em equilíbrio na borda, ser atingido por um meteoro ou os Senhores das Trevas da Matrix podem entrar e escrever “37” em uma das faces.
Se criássemos um símbolo mágico para representar “todas as possibilidades que não foram consideradas”, então poderíamos marginalizar os eventos, incluindo esse símbolo mágico, e chegar a um símbolo mágico “T” que representaria certeza infinita.
No entanto, prefiro questionar se existe uma maneira de derivar um teorema sem o uso de símbolos mágicos com comportamentos especiais. Isso seria mais elegante. Assim como existem matemáticos que se recusam a acreditar na lei dos conjuntos intermediários excluídos ou no infinito, gostaria de ser um teórico da probabilidade que não acredita na certeza absoluta.