1051548.jpg

二哈汪汪汉化

GF  2019-02-20 22:54
(新桥月白有偿汉化,欢迎老板垂询)

你究竟在什么时间打手冲? ——基于用户行为模式和大数据的一次传播量模型

仅供娱乐 不要问 问就是认真的  新桥月白日语社 转载注明来源 鸣谢有道翻译
   这里有一个问卷,希望大家有空填一下链接:[url]https://www.wenjuan.com/s/vuiAJrK/[/url]

你究竟在什么时间打手冲?
——基于用户行为模式和大数据的一次传播量模型
What time does the user punch?
—— a propagation quantity model based on user behavior pattern

作者:新桥月白日语社
The Author:NewBridgeMoonWhiteJapaneseClub






摘要

汉化组将本子、杂志等日物汉化为中文后,需要借助一些平台、论坛发布。汉化的日物是汉化组辛苦的劳动成果,每个汉化组都希望自己汉化的日物可以最大化它的价值。但是如何使用好发布平台,发挥内容的价值,对于很多汉化组,尤其是小型汉化组来说,仍然是一个难题。因此,本研究具有较强的实践意义和研究价值。

评价一个本子内容的指标有很多,例如阅读数、评论数、评分数之类。但是,归根结底,本子的实用性体现在手冲上,如何让自己的本子被更多人用来手冲,是本论文的研究目的。

关键词:手冲;大数据;传播量。


Abstract

After the Chinese group converts books, magazines and other Japanese articles into Chinese, it needs to use some platforms and BBS to publish. The hanhua Japanese objects are the fruits of the hard work of the hanhua group, and each group hopes that the hanhua Japanese objects can maximize its value. However, how to make good use of the publishing platform and give play to the value of the content is still a difficult problem for many Chinese groups, especially for small Chinese groups. Therefore, this study has strong practical significance and research value.

There are many indicators to evaluate the content of a book, such as number of readings, number of comments, and evaluation scores. However, in the final analysis, the practicality of the book is reflected in the hand, and the purpose of this study is to find out how to make the book be used by more people.

Key words: hand impulse; Big data; Spread amount.




第一章  绪论

1.1 研究目的
建立传播模型,帮助汉化组最大化本子价值。

1.2研究方法
基于大数据,数值分析,数理统计,将用户手冲行为与汉化组发布行为数据化,建立用户行为模式与汉化本发布模式的数学模型。

1.3研究路线
本研究分以下几步,逐步进行研究:
a、研究一天内手冲总人数在时间上的规律f(t)。
b、研究一天内本子发布总数在时间上的规律g(t)。
c、每次手冲需要的本子数的分布序列S以及手冲需要的本子数K。
K=S平均值

d、基本假设:设本子在平台的排列位置为X,本子发布时X=1,当其他本子发布时,此X会逐渐落后(数值增加);当本X>K之后时,认为此本停止传播。
e、本子传播时间T:根据K和g(t),得出一个本子从发布到停止传播所需要的时间。
g(T+t)-g(t)=K

f、本子传播量P:一个本子从发布到完全停止传播,总的传播量。
P= f(T+t)-f(t)

g、P取最大值,即可得出本子传播量最大的发布时刻t。





第二章  一天内手冲总人数在时间上的规律f(t)

2.1数据收集
通过本社团长时间的数据积累,挑选出具有代表性的几天,为保护用户隐私,具体日期和数据单位不予公布。


2.2 归一化
使用归一化公式:

将数据归一化,消除不同日期之间的数值绝对差异。
结果如下:


2.3 求平均
将不同日期的同一时间段的数据求平均值,使结果更加接近真实情况,结果如下:

绘制柱形图如下:

PS:没想到你们白天也这么致力于打手冲。凌晨6-7点打手冲人数最低,一定是都睡了。11-13点,打手冲人数出现略微下降,并且之后重新回升,这是要饭后冲一冲吗。17-18点,手冲人数出现断崖式下跌,这是应该是吃饭时间。0-1点手冲人数最多,比其他时间段里手冲人数最多的16-17点都要高出47.8%。


2.4 数值分析求解f(t)
过程很简单不写了,就是累加,再次归一化,数据拟合,求R-square。
图像如下:

曲线拟合结果如下:

相关系数 R-square=0.999899921092191

由于时间间隔较大,且图像斜率变化较小,一旦欠拟合会造成模型精度的严重下降,因此过拟合保证模型精度。





第三章  本子发布总数在时间上的规律g(t)
数据收集未完成,请等待后续研究




第四章  手冲需要的本子数分布S

这里需要你们的帮助!!!
   这里有一个问卷调查,如果大家有空的话可以填一下。
链接:[url]https://www.wenjuan.com/s/vuiAJrK/[/url]
谢谢大家帮我们收集数据。





第五章 结论
数据收集未完成,请等待后续研究




   最后打个广告,急招翻译嵌字



167149.jpg

隔壁老王

关于手冲一次大致需要几本,我一般也就一两本吧,主要剧情高潮部分那几页重复看,然后我就好了

931172.jpg

少女的黄瓜

B2F  2019-02-20 23:17
(她人即地狱,若有个开始也是好的。 [sell=0]出售內容[/sell])
基本都是晚上关上灯

none.gif

喵了个咪

硬核

IOP


illust-70063387-20200226-172907.jpg

黎昕

B5F  2019-02-21 00:06
(穷能观其肤白貌美,富能观其扇贝吐水)
过于有能

none.gif

h424771909

woc,牛逼啊

194485.jpg

assassingyk

B7F  2019-02-21 09:55
(专注催眠二十年)
毕 业 论 文(确信)

none.gif

lopqws

真滴牛批

030615h7h60sqzh7408aq5.gif

肛之炼茎术士

B9F  2019-02-21 13:37
(帝国的毁灭)
洗澡或者家里没人的时候冲一发

9bab091e00bf31ba.jpg

eze_twr_ylt

大致读了一下,发现这个模型相当有问题
根据我的理解,这个模型至少采用了以下两点假设:
1.每个人打手冲前才临时到网站上找本子
2.每个人都不加挑选地选择前K个本子
这与实际情况相差甚远,得到的模型就算在较大的发布平台上,也几乎没有参考价值

当然,强行有价值也没问题,毕竟论文都是这么水出来的,不然一大堆研究生怎么毕业呢?

938354.jpg

Kotena

就没有影音制品的选择吗

1072723.jpg

madrogue

B12F  2019-02-21 15:19
(「ならば 答えは1つ! あなたに忠誠を誓おう!」)
技术力过高

none.gif



B13F  2019-02-21 15:20
(往事随风辗转)
很专业

251162.gif

云飞雨散

硬核,帮顶