離脱率から仮想的なPV/Sessionを求める

仕事で考え事をしていて、離脱率からPV/Sessionを求めるときってどうすんだっけ、と考え始めた。

すべてのページで離脱率が等しいということはないので、あくまで仮想的な問題なんだけど、例えば離脱率が90%のとき。これは言い換えれば10%が離脱せずページ遷移することを表す。

つまりこうなるはずだ。

1+0.1+0.001+0.0001+……=1.1111111111……

もうちょっと数学っぽく書く。

1+0.11+0.12+0.13+……+0.1n+……+0.1^∞

limとかつかうとこうか(PCでの数式の作法は知らないのでてきとう)

1+Σ[n=1,∞]0.1n

離脱率90%のケースは1.1111111なので1+1/9であることはわかる。問題はこれをどうやって一般化しているのか。とりあえず家にあった数学の本を開いて、極限とか調べてみる。

理系数学サマリー―高校・大学数学復習帳

理系数学サマリー―高校・大学数学復習帳

悪くない本だと思うんだけど、復習帳って感じでこのトピックが知りたいんだよねーというのには向いていない。昼間は見ていたドラマが面白かったし、無視して1日ダラダラ過ごしていた。

弁護士の条件

弁護士の条件

SUIT、Amazonでシーズン5見れるようになった。面白い。

グリムの末裔

グリムの末裔

グリムもシーズン4やってますね。いい感じ。

のんびりとした休日を過ごして、寝る前にシャワー浴びてたらどうもこの問題の解法が気になったので真面目に調べることにした。

はじめに数式はわかってるわけだから、Spreadsheetsでどうにかならないかなと思って、関数リストを眺めてみたけど、どうもそれらしいやつがない。

Google スプレッドシートの関数リスト - ドキュメント エディタ ヘルプ

もうちょっと素直な感じで、ぐぐってみた。 適当に「lim(sum1/2n)」とか打ち込んでいると、サジェストで「lim sum ½n」と出てきたので検索結果を見る。

½ + ¼ + 1/8 + 1/16 + ⋯ - Wikipedia

あっさり解決した。証明もわかりやすい。今回の問題で、求めるPV/SessionをSnのnを∞としたときとする。ついでにはじめのPVである1は無視して考えて、あとで足す。

Sn=0.11+0.12+0.13+……+0.1n-1+0.1n

両辺を10倍する(0.1の逆数)

10*Sn=1+0.11+0.12+0.13+……+0.1n-1

「0.11+0.12+0.13+……+0.1n-1」の部分は元のSnから最後の0.1nを取ったものになっている。つまりこう書き換えられる。

10*Sn=1+Sn-0.1n

両辺からSnをひく

9*Sn=1-0.1n

0.1nはnを∞にしたとき、限りなく0に近づく。よって

9*Sn=1 Sn=1/9

一般化すると継続率がkのとき。仮想的なPV/Sessionは

k/(1-k)

で求めることができる。

5%刻みで計算してグラフにするとこうなる。

離脱率から仮想PV/Sessionを求める - Google スプレッドシート

調べたいことが決まっているときは、教科書よりもGoogle検索のほうが役に立つ。しかしながら、数学復習しようかなという気になることも多い。

理系数学サマリー―高校・大学数学復習帳

理系数学サマリー―高校・大学数学復習帳