안녕하세요. 김통계입니다. 지난번 글은 조회 수, 생존율, 추천 수, 댓글 수 등이 보이는 현상 그 자체에 대한 이해였다면, 이번 글은 창작 활동의 본질적인 동기인 이익의 측면에 집중해보고자 합니다. 오늘의 주제는 전환율입니다.

---

"유료화 이후 얼마나 많은 독자들이 내 글을 따라올 것인가?"는 글로 돈을 버는 작가들의 공통적인 관심사일 것이다. 조회 수 분석 2에서도 이와 관한 내용을 다루었지만, 그 글은 유료화 이전 글의 변화가 유료화 이후에 어떤 영향을 미치는지에 더 초점이 맞춰져 있었다. 초점의 방향이 달라서인지 조회 수 글에서도, 추천 수에 관한 글에서도 전환율에 관해 묻는 댓글이 있었다. 이번 글을 통해 그 질문에 관한 답을 하고자 한다.

- 글을 다 쓰고 나서 올리기 전에야 웹연갤에서는 전환율이라는 용어를 사용한다는 것을 알았다. 수정하기에는 번거로움이 있어서 그냥 올리지만, 둘이 같은 용어임을 알린다.


자료의 수집

앞선 글에서 이야기했듯이 이 분석은 유료화 12시간 이내에 한 번, 유료화 30~31일 후 한 번 측정된 자료를 바탕으로 하고 있다. 따라서 유료화 이후를 나타내는 자료의 속성은 대략적으로 유료화 후 27일(최신 3화 제외) 자료의 평균을 바탕으로 하고 있음을 밝힌다.


유지율의 정의

유지율은 선호작 유지율과 조회 수 유지율로 구분하여 분석하였다. 선호작 유지율의 경우 유료화 전후의 선호작 수를 바탕으로 계산하였으며, 조회 수 유지율은 유료화 전후 평균 조회 수를 통해 계산하였다. 조회 수의 경우 총 조회 수가 아닌 평균 조회 수를 사용한 것은 개별 작품마다 유료화 전환 시기가 크게 달랐기 때문이며, 이를 보정하기 위해 평균값을 사용하여 기간에 따른 패널티를 부여하였다.

유지율의 주요 통계량은 다음과 같다.


< 그림 00 > 



성별, 연령별 특성

먼저 성별과 연령이 성별과 연령이 유지율에 영향을 미치는지를 살펴보았다.

성별은 남성 대 여성의 비율로 정의된 남녀비를 사용하였으며, 연령은 문피아에서 공개하는 연령 비율 자료를 사용하였다. 변수 간 관계를 확인하기 위해 상관분석을 실시하였다.

분석 결과 성별은 영향을 미치지 않는 것으로 나타났으며, 연령의 경우 20대와 30대의 비율이 높은 경우에 조회 수 유지율에 긍정적인 영향을 미치는 것으로 나타났다. 반면 40대와 50대의 비율은 구매와 부적(-) 관계를 나타내고 있었다. 이는 당연한 결과인데, 20~30대의 비율이 높다면 그 작품은 40~50대의 비율이 낮아지기 때문이다. 따라서 이 결과는 40~50대의 구매력이 낮다는 것으로 해석하기보다는 20~30대의 구매력이 높다는 것으로 해석하는 것이 바람직하다.

< 그림 01 >


유지율을 예측하기 위한 변수의 선정

유료화 전후의 독자 수 유지 비율을 추정하기 위해 유지율과 여러 예측변수들(17개) 간 상관분석을 실시하였다. 높은 상관을 보였던 변수로 다음의 두 가지가 선정되었다. 첫째는 "총 추천/총 조회 수 *100"으로 계산한 총 조추비(총 조회 수 대비 총 추천 수의 비율)이며, 둘째는 생존율이 100을 넘은 회차가 전체 연재 수에서 어느 정도의 비율인지를 계산한 "100 이상 생존율 비율"이다. 이하 100 이상 생존비라고 부른다.

(100 이상 생존비는 유료화 이전 전체 연재 편수에서 초반 3화와 마지막 3화를 제외한 자료를 이용하여 계산한다. 먼저 개별 편의 생존율을 계산한 뒤, 생존율이 100을 넘은 편의 개수가 전체 중에서 어느 정도의 비율을 차지하는지를 통해 구한다.)

다른 변수들은 낮은 상관관계를 보이거나 등분산 가정을 만족하지 못하는 등의 이유로 기각되었다. 따라서 총 조추비와 100 이상 생존비, 두 변수를 이용하여 분석을 진행한다.


총 조추비를 이용한 예측

총 조추비는 유료화 이전 총 추천 수를 분자로 하고, 총 조회 수를 분모로 하여 계산한다.

<그림 02> 


조회 수 대비 추천 수의 평균적인 비율은 약 2.4% 정도이다. 최대값은 약 4.5%, 최소값은 약 1.3%로 나타났다. 어떤 작품이 대략적으로 3% 이상의 비율을 보인다면 상당히 높은 추천 수라고 볼 수 있다. 이전 글에서 밝혔듯이 추천을 누른 독자는 그렇지 않은 독자에 비해 유료화 이후까지 따라갈 가능성이 약 3배 높으므로, 추천 수를 확보하는 것은 유료화 이전의 중요한 요소 중 하나이다.

조추비를 이용한 선호작 유지율의 분석 결과는 다음과 같다. 

값은 18.3으로 모형이 유의함을 보였다.

(※ 단순선형회귀분석은 자료를 가장 잘 설명할 수 있는 직선(일차방정식)을 찾아내는 통계 분석 방법이다. 따라서 결과를 y = a(절편) + bx(변수) + ε(오차)의 형태로 나타낼 수 있다.)

분석 결과 추정된 회귀식은 다음과 같다.

y = 60.046 + 6.81659(총 조추비) ±1.96*8.286 (95% 신뢰구간)

예를 들어, 자신의 작품이 약 3%의 조추비를 보인다면 3을 총 조추비에 대입하면 된다. 이는 60.046 + 6.81659*3 ±1.96*8.286 으로 계산되므로, 64.25521 ~ 96.73633 의 범위를 가진다. 즉, 유료화를 할 경우 64.3%~96.7%의 선호작 유지율을 기대할 수 있는 것이다. 다만 통계 분석과는 별개로 이 글에서는 최소치를 추정하는 것에 초점을 맞추고자 한다. 이는 수익의 최소치를 추정함으로써 최대한 보수적인 결론을 내리고자 하는 것이다. 따라서 조추비 3%의 작품은 64.3%~80.5%(: 평균값, ±(오차)에서 +를 하지 않은 값)의 유지율을 보일 것이라고 기대할 수 있다.


조회 수의 유지율도 같은 방식으로 추정해볼 수 있다.

< 그림 05 > 

F값은 28.33으로 모형이 유의함을 보였으며, 추정된 회귀식은 다음과 같다.

y = -3.4319 +5.2246(총 조추비) ±1.96*5.776

위 결과는 약 30일의 연재분 평균 조회 수를 통해 추정한 값이라는 점에 유의해야 한다.

위의 회귀식 또한 앞선 방법과 마찬가지로 분석에 사용할 수 있다. 약 3%의 조추비를 가지고 있다고 가정했을 때, 식에 대입하면 0.92084 ~ 12.2418(: 평균)의 범위를 얻는다. 따라서 유료화 이후 30일 평균의 조회 수는 유료화 전에 비해 1%에서 12.2% 정도로 나타날 것을 기대할 수 있다.

< 그림 06 > 

그러나 총 조추비는 그다지 좋은 지표라고 보기 어렵다. 위의 그림처럼 총 조추비의 증가에 따라 분산이 달라지기 때문에 등분산 가정이 지켜진다는 보장을 하기 어렵다. 다만 작가들이 복잡한 사전 계산 없이 문피아에서 제공하는 기본 정보를 통해 유료화 이후를 추정할 수 있다는 장점이 있기 때문에 해당 지표를 이용한 분석을 소개하였다. 따라서 총 조추비를 이용한 예측은 어디까지나 보조적으로만, 참고 자료로만 사용되어야 한다.



100 이상 생존비를 이용한 예측

100 이상 생존비는 전체 연재 중 생존율이 100을 넘은 화의 비율로 계산한다. 만약 자신이 유료화 이전에 50화를 연재하였고, 이 중에서 10편의 생존율이 100 이상이라면 20%의 생존비를 가지게 된다.

< 그림 07 >


평균적인 생존비는 18.75이며, 표본은 최소 2.27에서 최대 52.6의 범위를 보였다.

나는 이전 글을 통해 생존율은 자신의 작품에 재미를 느낀 독자의 수를 반영하는 지표임을 주장하였으며, 해당 글에서 평균 생존율의 증가가 유료화 이후의 조회 수에 영향을 준다는 점을 밝힘으로써 유료 전환 이후에도 따라오는 충성 독자를 식별할 수 있는 지표임을 밝힌 바 있다. 또한, 생존비는 총 조추비에 비해서 더 높은 유지율과의 상관관계를 보인다. 따라서 정확한 예측을 위해서는 다소 번거롭더라도 생존율을 계산하여 생존비를 도출하는 것이 필요하다.

생존비를 이용한 선호작 유지율의 예측은 다음과 같다.

< 그림 09 > 

F값은 27.33으로 모형이 유의함을 보였다. 추정된 회귀식은 다음과 같다.

y = 66.2281 + 0.5588(생존비) ±1.96*7.7

R^2값은 0.3831로 나타나, 위 식이 전체 변량의 38.31%를 설명하고 있음을 알 수 있다. 이는 총 조추비 28.91%보다 높은 수치이며, 생존비를 이용한 방식이 더 우수함을 확인할 수 있다.

앞선 방법과 마찬가지로 위 식에 자신의 생존비를 대입하여 유료화 이후 선호작 변동을 예측해볼 수 있다. 자신의 생존비가 20(20%)일 때 위 식에 대입하면 62.3%~77.4%(: 평균)의 선호작 유지율을 기대할 수 있다.


조회 수의 유지율도 같은 방식으로 추정해볼 수 있다.

< 그림 10 > 

F값은 48.88로 모형이 유의함을 보였다. 추정된 회귀식은 다음과 같다.

y = 1.56315 +0.40392(생존비) ±1.96*5.269

생존비가 20일 때의 추정 범위는 -0.68569~9.64155의 범위를 가진다. 0보다 작은 수는 적절하게 해석할 수 없으므로 0으로 취급하여 계산해야 한다. 이 경우 약 0%~9.6%의 조회 수 유지율을 예측할 수 있다.


Reduced model only

조회 대비 추천 비율과 100 이상 생존율의 비율을 동시에 사용하여 예측한다면 더 정확한 결론을 얻을 수 있을까? 답은 "아니다"이다. 두 변수는 공유하는 분산이 많기에 공선성 문제가 발생한다. 쉽게 말하자면 두 변수의 속성이 비슷하여 겹치는 부분이 너무 많은 것이다. 따라서 모형의 제작에 있어서 두 변수를 동시에 투입하는 것은 유의미한 이득을 제공하지 않는다. 그러므로 간단하게 계산하고 싶다면 총 조추비를, 더 정확한 예측을 하고 싶다면 생존비를 이용하여 예측하면 된다.


추가 사항

유료화 이전의 지표

↓  유지율의 계산

유료화 이후 조회 수 예측

↓  (유료화 이후) 생존율을 이용한 독자 감소율 추정

완결까지 남아있을 것으로 예상되는 독자의 수

= 총 수익

위의 방식을 통해 유료화 이전 단계에서 완결 시의 총 수익을 예측해볼 수 있다. 다만 정확성을 보장하지는 않는다.


---



세 줄 요약

1. 유료화 이전에 나타난 지표를 통해 유료화 이후의 선호작 수, 월 평균 조회 수를 예측하는 모형을 만들어보았다.
2. 글 중간에 있는 식에 지표를 대입하면 예상 유지율(전환율)을 구할 수 있다.
3. 추천 수 비율을 이용한 지표는 부정확하니 생존비를 계산하여 쓰도록 하자.


출처:유료화 전환율 예측 - 웹소설 연재 갤러리 (dcinside.com)