Максу слишком часто стали приходить электронные письма с предложениями купить чудодейственные лекарства или новые пылесосы. Так как Макс — программист, он решил самостоятельно написать систему для фильтрации спама.
Вероятность того, что сообщение, содержащее слово $$$W$$$, — спам, определяется по формуле
$$$$$$P(W) = \frac{\frac{(N_{bad} + 1)}{(M_{bad} + M)}}{\frac{(N_{good} + 1)}{(M_{good} + M)} + \frac{(N_{bad} + 1)}{(M_{bad} + M)}}$$$$$$
В этой формуле:
- $$$N_{good}$$$, $$$N_{bad}$$$ — количество раз, когда слово $$$W$$$ встречалось в нормальных сообщениях и в спам-сообщениях соответственно;
- $$$M_{good}$$$, $$$M_{bad}$$$ — общее количество слов в нормальных сообщениях и спам-сообщениях соответственно;
- $$$M$$$ — общее количество различных слов во всех видах сообщений.
Вероятность того, что сообщение из слов $$$W_1$$$, $$$W_2$$$, ..., $$$W_K$$$ — спам, определяется по формуле
$$$$$$P(W_1, W_2, \ldots, W_K) = \frac{P(W_1) \cdot P(W_2) \cdot \ldots \cdot P(W_K)}{P(W_1) \cdot P(W_2) \cdot \ldots \cdot P(W_K) + (1 - P(W_1)) \cdot (1 - P(W_2)) \cdot \ldots \cdot (1 - P(W_K))}$$$$$$
Макс уже классифицировал все письма, которые приходили к нему раньше, как спам или не спам. Помогите Максу определить, является ли спамом очередное сообщение.