手机浏览器扫描二维码访问
作為一名合格的科研工作者,謝與非先開始做文獻收集工作。
snetkI上的文獻也不算很多,於是謝與非只好從最基礎的做起——先篩選知名小說網站和app。
不多時就進入到了著名的網文論壇,從中篩選出基本符合要求的平台若干。
然後再細分,哪些網站以霸總小白文見長,哪些受眾比較多樣化。
接著呢,就是科研狗們最喜歡的收集數據階段。
謝與非花了兩個晚上,研究了各類榜單的排名和更依據,從論壇里搜集了大量資料,甚至搞明白了幾大平台女頻的各種打榜暗箱操作。
於是她——開始看小說了?
不,蠢蠢欲動想要寫個刷票小程序和網站的算法較量一下,看能不能被識破。
但是理智告訴她,做研究要不忘初心,總結霸總的行為規律才是要任務,於是又回歸到了霸總文本身。
開始的時候,謝與非做了個exce1表,裡面列了各個網站排名前十的霸總文,並且按照簡介和名字做了分類。
通過閱讀大量的書評,掃文號和論壇討論貼可知,霸總文只是一個大項目,裡面還分有不同的小類與流派。
根據題材可以分為重生,穿越,現實,古代等等,穿越下面還有,等小類。
根據風格還可以分為「甜寵型」,「強迫型」,「型」,「契約情人型」等等。分析平台的榜單排名可知,目前「虐戀型」已經過時,「甜寵型」和「火葬場型」正在當紅。
表列到這裡,謝與非發現單純的表格已經不能滿足她了,這種複雜的分類需要一個坐標系。
於是畫起了橫軸和縱軸。
除了文章風格,作為霸總文靈魂的「霸總」當然也需要分類。
什麼型霸總,粗暴型霸總,外冷內熱型霸總,智商極高型霸總,反正也是需要一個坐標系來畫明白的。
畫著畫著圖她的思維又開始奔逸了,像霸總文這種具有高度同質性並且特徵明顯的小說,是不是可以先收集大量數據建立一個語料庫,然後再寫一個算法讓aI自動出產霸總文,只要輸入想要的屬性標籤,然後就可以自動從語料庫里摘取句子生成語段。同理可證那些打臉文、、文都可以一樣產出。
小貼士:如果覺得不錯,記得收藏網址或推薦給朋友哦~拜託啦(.&1t;)
&1t;:
简介关于吞天万剑诀我有一剑,可吞万物!书友群2o9739o77各位书友如果觉得吞天万剑诀还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...
林徐成缓慢的将最后一颗朱砂子弹压进弹仓内,从容的点燃一支烟, 做警察‘第一诫’这个世界上没有鬼。...
叶清扬是一个资深武侠小说爱好者,突然获得了一个视频网站的邀请。视频网站名为武侠至尊,竟然连通华夏所有武侠小说的平行位面!布视频不仅可以让各个武侠世界的人看到,还能获得奖励!叶清扬不信邪,将手上做好的盘点武侠十大高手的视频布了出去!萧峰在我萧峰的Bgm里,无人能够打败我!段誉我不爱武视频通武侠开局盘点十大高手...
梁宽穿越到港综世界,成了一名卧底。上司殉职,他也成了断线的风筝。是继续完成自己的使命,还是去满足自己的野心,这是一个难题。但,先,他要活下去,努力的活下去!!!斗社团,耍差佬,收美女,一步步登上黑道巅峰,将每一个对手都踩在脚下。我不想当卧底,我要当黑夜中的使徒。我选的,耶稣都改变不了。这是一个港综世界,各种电影的融合,让每个人的身份都变得神秘莫测,需要你细心品读。(温馨提示,都是最经典的角色。)...
你见过白狗穿衣,老鼠吃猫吗?你听说过纸人唱戏,飞僵吸血吗?来,你听我讲...
官场即关场!关关难过关关过,神魔挡路杀神魔!当女友跳楼领导打压人生绝望之际,五十岁的老张从天而降拯救机关小白!开局双灵魂,智多近乎妖。今后青云路,一切靠大脑。身居低位却能搅动机关漫天风云,翻江倒海只为寻找女友死亡真相,丝滑连招抱上高冷美女部长白腿,胸中沟壑拿下政商两界大佬千万。机关小科员的逆袭青云路,现在开始!...