O que são correntes Markov, quando usá-las, e como elas funcionam
As cadeias Markov são uma forma bastante comum, e relativamente simples, de modelar estatisticamente processos aleatórios. Elas têm sido usadas em muitos domínios diferentes, desde a geração de textos até a modelagem financeira. Um exemplo popular é o r/SubredditSimulator, que usa cadeias Markov para automatizar a criação de conteúdo para todo um subreddit. Em geral, as Cadeias Markov são conceptualmente bastante intuitivas, e são muito acessíveis, pois podem ser implementadas sem o uso de quaisquer conceitos estatísticos ou matemáticos avançados. Elas são uma ótima maneira de começar a aprender sobre modelagem probabilística e técnicas de ciência de dados.
Cenário
Para começar, vou descrevê-las com um exemplo muito comum:
Imagine that there were two possible states for weather: sunny or cloudy. You can always directly observe the current weather state, and it is guaranteed to always be one of the two aforementioned states.Now, you decide you want to be able to predict what the weather will be like tomorrow. Intuitively, you assume that there is an inherent transition in this process, in that the current weather has some bearing on what the next day's weather will be. So, being the dedicated person that you are, you collect weather data over several years, and calculate that the chance of a sunny day occurring after a cloudy day is 0.25. You also note that, by extension, the chance of a cloudy day occurring after a cloudy day must be 0.75, since there are only two possible states.You can now use this distribution to predict weather for days to come, based on what the current weather state is at the time.
Este exemplo ilustra muitos dos conceitos chave de uma cadeia de Markov. Uma cadeia de Markov consiste essencialmente de um conjunto de transições, que são determinadas por alguma distribuição de probabilidade, que satisfazem a propriedade Markov.
Observe como no exemplo, a distribuição de probabilidade é obtida apenas pela observação das transições do dia corrente para o dia seguinte. Isto ilustra a propriedade Markov, a característica única dos processos de Markov que os torna sem memória. Isso normalmente os deixa incapazes de produzir com sucesso seqüências nas quais se espera que alguma tendência subjacente ocorra. Por exemplo, enquanto uma cadeia de Markov pode ser capaz de imitar o estilo de escrita de um autor baseado em freqüências de palavras, ela seria incapaz de produzir texto que contenha significado profundo ou significado temático, uma vez que estes são desenvolvidos ao longo de seqüências de texto muito mais longas. Falta-lhes, portanto, a capacidade de produzir conteúdo dependente do contexto, uma vez que não podem levar em conta toda a cadeia de estados anteriores.
>