게임 이론 어쩌고 하다가 나온 말인데 가위바위보를 어떤 전략으로 하는 게 좋으냐~ 하는 것.
특별한 약점이 없는 전략으로 가위, 바위, 보를 랜덤하게 1/3의 비율로 내는 전략을 말씀하셨다.
횟수가 많아지면 어떤 전략을 상대로 하더라도 안정적인 승률을 보장한다.
나중에 생각해보면서 정리한 건데 안정적인 승률정도가 아니라 모든 전략을 상대로
아예 질 확률과 이길 확률이 똑같다.
나는 개인적으론 저런 거 안 좋아하지만
(사나이라면 당연히 리스크를 감수하더라도 큰 걸 노려야하는 거 아닌가여?)
어찌됐든 저런 전략이 좋단다.
근데 여기서 인터럽트.
그러면 가위바위보에서 승리에 대한 보상이 가위, 바위, 보에 따라 다르면 어떨까?
그러니까 가위바위보해서 계단 올라가기를 하는데 가위로 이기면 3칸 올라가고
바위로 이기면 올라가면 2칸 올라가고 보로 이기면 1칸 올라간다면?
어떤 비율로 내면 보상이 같을 때 1/3씩 내는 것처럼 안정적일까?
당장 그 자리에선 일단 난 룰을 그렇게 바꿔도 특정 선택을 많이 하는 게
유리해지고 그런 건 없을 것 같다-라고 대답했고 (가위가 3칸이니 좋다고 많이 내면 당연히
상대방은 바위를 많이 낼 거니까 기대값은 떨어질 것이고 하니...)
옆에 있던 동기는 보상의 역수를 비율로 해서 내는 게 좋을 것 같다고 대답했다.
다음 시간까지 생각해보라고 하셨다.
당장 동아리방에서 고민 고민.
처음에 비율을 대충 정해놓고 상대방이 나와 같은 전략을 쓸 거라고 해놓고
조금씩 비율을 조정하다보면 점점 특정 비율에 수렴해가지 않을까하는 생각이 들었다.
하망님은 보상의 제곱이라든지? 정도의 전략을 추정하셨음.
... 근데 아무리 해봐도 수렴을 안 해 (...)
비율들이 막 위 아래로 댄스를 추면서 수렴을 안 한다.
유전 알고리즘이라도 써야하나 (...) 하다가 문득 수학적으로 정리를 해보면 어떨까 싶어서 해보았다.
여기서부터는 스포일링일지도 (?)
자기 생각으로 알아보고 싶은 사람은 안 보는 게 좋을 것 같다.
상대방이 낼 가위, 바위, 보의 비율을 a, b, c로 놓고 내가 낼 비율을 x, y, z로 놓았을 때
기대되는 보상치는 가위, 바위, 보를 냈을 때 각각 이길 확률을 모두 더한 것이다.
(일단 가위, 바위, 보의 보상이 다 같은 경우)
이기는 경우는 내가 가위를 내고 상대방은 보,
내가 바위를 내고 상대방은 가위,
내가 보를 내고 상대방은 바위를 내는 경우이다.
즉, xc + ya + zb이다.
거꾸로 상대방이 이기는 경우는 손해가 되므로 보상치에서 빼준다.
xb + yc + za이므로 총 보상치는 xc + ya + zb - xb - yc - za.
비기는 경우는 아무런 보상이 없으므로 그냥 0으로 보면 된다.
여기서 "상대방의 전략에 상관없이 안정적"인 전략을 위해서라면
기대되는 보상치가 상대방의 전략(a, b, c)에 의존적이어선 안 된다.
a, b, c로 묶어보면
a(y - z) + b(z - x) + c(x - y)이다.
그래서 x = y = z일 때 a, b, c에 독립적인 보상치를 만들 수 있으며
이 때의 기대치는 0이므로 모든 전략에 대해 이기거나 질 확률이 완전히 같은 것이다.
근데 보상이 다른 경우엔 어떨까?
발생 상황의 확률에다가 보상치를 다 곱해주면 총 보상치는 이렇게 된다.
3xc + 2ya + zb - 2xb - yc - 3za
똑같이 묶어보면
a(2y - 3z) + b(z - 2x) + c(3x - y)이다.
a, b, c에 독립적으로 만들려면
2y = 3z, z = 2x, 3x = y를 동시에 만족해야하는데 불가능(!)하다.
모순이 생긴다!!
x, y, z가 모두 0인 경우 밖에 해가 존재하지 않는다.
근데 x, y, z가 내 전략의 비율이므로 x + y + z = 1 ... 따라서
결론은 보상치가 모두 같은 경우가 아니라면 상대방의 전략에 상관없이
안정적인 승률을 보장하는 전략은 존재하지 않는다는 것.
(3, 2, 1도 미지수로 놓고 해보면 얘네들이 같을 때만 같은 비율로 내는
안정적인 승률을 보장할 수 있는 전략이 존재한다는 걸 알 수 있다)
오오. 문득 수학적인 시도를 해보다가 그런 전략이 없다는 걸 증명해버렸다 (...)
담 시간에 교수님 앞에서 증명하고 우쭐거려야지 음하하.
이 글 보고....
눈물이 나는건...
후.. 공돌아...
임마 이건 공학보단 오히려 수학에 가까운 거지!
그리고 게임 이론 같은 건 경제학에서도 졸라 하는 거라능
좀더 논리에 맞으려면
안정적인 기대치를 K로 놓고
a(y-z) + b(z-x) + c(x-y) - K = 0 의 식을
a, b, c에 상관없이 만족하게 하려면 x = y = z 이어야 한다.
이런 식으로 해야 하지 않을까요;
A는 B이다라고 말하는 거랑 A - B = 0이란 식은 동치잖아 ㅎㅎ
인간의 기대 심리(큰걸내면 유리하다, 큰걸 이기는게 유리하다) 이게 이미 미지수의 값인데,
적용하면 이미 수식이 아니잖.
그 큰 걸 내면 유리하다는 생각에서부터 시작해서 실제로 얼마나 유리한 건지를 수치화해보고
기대값을 구해보는 게 게임 이론으로 하는 일이지~
이거 틀렸다 ㅋㅋㅋㅋㅋㅋㅋ 아 다 해놓고 마지막에 이게 무슨 ㅋㅋ
2y = 3z, z = 2x, 3x = y 이거 모순 안 생김.
1:3:2로 하면 안전한 전략 나옴 ㅋㅋ
학교에서 화이트보드에 대고 할 때 뭔가 잘못한 듯. 거기서 다 했던 거라 쓸 때 아무 생각없이 썼더니 (...)
오늘 발표하는데 "자 그래서 이렇게 하면 여기서 모순이 생기므로 해가 없..."
"되는데?"
"어!!!!????"
... 개그였음
머시라? 이런거 수학으로 되는겨? '브티풀 마인드'라는 영화, 책 봤스? 분열증 걸린 천재 수학자 야긴데.
그런 영화 보는 기분이네. 전혀 낯선 세계이지만 외경심이 드는 ㅋㅋ. 모자라는 인간들에겐 무질서로 보이는 현상에서
수치화되는 법칙을 끌어낼 수 있는 그대(들 ). . . 다음 생에 태어 날 수 있다면 그런 머리를 갖고 싶네.
한번에 답이 나온게 아니라, '개그'의 한 장면 연출 한 뒤의 반전 또한 멋지네.
영화의 한 장면이라면, 다른 친구가 영대의 최초 공식으로 우쭐댈때,
영대가 '잠깐! 이리저리해서 되는디~'해서 반전을 시키면, 오오 내 아들~~ 기립박수$$$$
이거만 읽고 여자친구한테 문제로 냈는데 여자친구가 일정한 비율로 내면 성립하는 경우를 제시해버림.