1051548.jpg

二哈汪汪汉化

GF  2019-02-20 22:54
(新桥月白有偿汉化,欢迎老板垂询)

你究竟在什么时间打手冲? ——基于用户行为模式和大数据的一次传播量模型

仅供娱乐 不要问 问就是认真的  新桥月白日语社 转载注明来源 鸣谢有道翻译
   这里有一个问卷,希望大家有空填一下链接:[url]https://www.wenjuan.com/s/vuiAJrK/[/url]

你究竟在什么时间打手冲?
——基于用户行为模式和大数据的一次传播量模型
What time does the user punch?
—— a propagation quantity model based on user behavior pattern

作者:新桥月白日语社
The Author:NewBridgeMoonWhiteJapaneseClub






摘要

汉化组将本子、杂志等日物汉化为中文后,需要借助一些平台、论坛发布。汉化的日物是汉化组辛苦的劳动成果,每个汉化组都希望自己汉化的日物可以最大化它的价值。但是如何使用好发布平台,发挥内容的价值,对于很多汉化组,尤其是小型汉化组来说,仍然是一个难题。因此,本研究具有较强的实践意义和研究价值。

评价一个本子内容的指标有很多,例如阅读数、评论数、评分数之类。但是,归根结底,本子的实用性体现在手冲上,如何让自己的本子被更多人用来手冲,是本论文的研究目的。

关键词:手冲;大数据;传播量。


Abstract

After the Chinese group converts books, magazines and other Japanese articles into Chinese, it needs to use some platforms and BBS to publish. The hanhua Japanese objects are the fruits of the hard work of the hanhua group, and each group hopes that the hanhua Japanese objects can maximize its value. However, how to make good use of the publishing platform and give play to the value of the content is still a difficult problem for many Chinese groups, especially for small Chinese groups. Therefore, this study has strong practical significance and research value.

There are many indicators to evaluate the content of a book, such as number of readings, number of comments, and evaluation scores. However, in the final analysis, the practicality of the book is reflected in the hand, and the purpose of this study is to find out how to make the book be used by more people.

Key words: hand impulse; Big data; Spread amount.




第一章  绪论

1.1 研究目的
建立传播模型,帮助汉化组最大化本子价值。

1.2研究方法
基于大数据,数值分析,数理统计,将用户手冲行为与汉化组发布行为数据化,建立用户行为模式与汉化本发布模式的数学模型。

1.3研究路线
本研究分以下几步,逐步进行研究:
a、研究一天内手冲总人数在时间上的规律f(t)。
b、研究一天内本子发布总数在时间上的规律g(t)。
c、每次手冲需要的本子数的分布序列S以及手冲需要的本子数K。
K=S平均值

d、基本假设:设本子在平台的排列位置为X,本子发布时X=1,当其他本子发布时,此X会逐渐落后(数值增加);当本X>K之后时,认为此本停止传播。
e、本子传播时间T:根据K和g(t),得出一个本子从发布到停止传播所需要的时间。
g(T+t)-g(t)=K

f、本子传播量P:一个本子从发布到完全停止传播,总的传播量。
P= f(T+t)-f(t)

g、P取最大值,即可得出本子传播量最大的发布时刻t。





第二章  一天内手冲总人数在时间上的规律f(t)

2.1数据收集
通过本社团长时间的数据积累,挑选出具有代表性的几天,为保护用户隐私,具体日期和数据单位不予公布。


2.2 归一化
使用归一化公式:

将数据归一化,消除不同日期之间的数值绝对差异。
结果如下:


2.3 求平均
将不同日期的同一时间段的数据求平均值,使结果更加接近真实情况,结果如下:

绘制柱形图如下:

PS:没想到你们白天也这么致力于打手冲。凌晨6-7点打手冲人数最低,一定是都睡了。11-13点,打手冲人数出现略微下降,并且之后重新回升,这是要饭后冲一冲吗。17-18点,手冲人数出现断崖式下跌,这是应该是吃饭时间。0-1点手冲人数最多,比其他时间段里手冲人数最多的16-17点都要高出47.8%。


2.4 数值分析求解f(t)
过程很简单不写了,就是累加,再次归一化,数据拟合,求R-square。
图像如下:

曲线拟合结果如下:

相关系数 R-square=0.999899921092191

由于时间间隔较大,且图像斜率变化较小,一旦欠拟合会造成模型精度的严重下降,因此过拟合保证模型精度。





第三章  本子发布总数在时间上的规律g(t)
数据收集未完成,请等待后续研究




第四章  手冲需要的本子数分布S

这里需要你们的帮助!!!
   这里有一个问卷调查,如果大家有空的话可以填一下。
链接:[url]https://www.wenjuan.com/s/vuiAJrK/[/url]
谢谢大家帮我们收集数据。





第五章 结论
数据收集未完成,请等待后续研究




   最后打个广告,急招翻译嵌字



none.gif

喵了个咪

B1F  2019-02-20 23:18
硬核