QQ登录

只需一步,快速开始

80后炒股配资网

80后炒股配资网 80后网赚 炒股知识 查看内容

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...

2021-3-3 18:01/ 发布者: admin| 查看: 70/ 评论: 0

关注我,让我成为你的专属小太阳吧

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


背景介绍


消息很重要,可咱耳朵不够长,股评家们两片嘴,左右都是理”。大约十年前,歌曲《股民老张》中几句歌词表达了 普通股民的无奈。目前 中国资本市场的显著特征之一是个人投资者交易量占比较高,但盈利表现相对较差。2017年个人投资者的交易金额占到年度交易总额的82.01%,而机构仅占14.76%。但在盈利方面, 机构投资者整体盈利明显跑赢散户,且机构投资者的投资表现更加稳定,2017年机构整体盈利金额是散户的3.6倍(数据来源:上海证券交易所统计年鉴)。其原因就是 股民老张很难通过阅读股评和消息来正确判断投资方向和选股策略。


为了帮助股民老张们解决选股策略学习的困境, 本报告将分别爬取东方财富网机构研究报告中心的个股研究和东方财富网股吧讨论区的热门讨论数据,通过构建逻辑回归模型探究股评情绪、股评影响力和股票情况对股票盈利情况的影响。由此为贡献股票市场交易量八成的个人投资者们提供根据不同来源的股评消息选股参考,帮助个人投资者提升理性投资能力。


数据说明


本文使用数据来自东方财富网机构研究报告中心、股吧两个版面(分别代表专业和非专业股评)近半年的热门区数据,分别爬取券商个股研究报告28,702篇,非专业机构的股民讨论9,741篇主题帖。剔除点赞数低于100、非交易日讨论等无效数据后,得到观测值17,631条。


老张所研究的因变量是中短线投资的股票盈利情况,在时间窗口上,以机构研报发布日或股吧热贴发贴日为T日,因变量可量化为T+7收盘价的变化幅度。由于股票价格受市场波动较为严重, 该变量以沪深300指数作为参照,在股票涨幅比大盘涨幅大,或股票跌幅比大盘跌幅小的情况下,即可盈利。本文构建预测模型的变量可分为 股评情绪(研报评级、特征词)、股评影响力(券商等级、股吧吧龄、股吧阅读量)和股票情况(是否创业板)三类。具体变量情况说明如表1所示。


1数据变量说明表

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


展开全文

描述分析


因变量:股票表现


本文所用数据中,券商研报涉及股票盈利比例48.4%,股吧热贴讨论股票盈利比例53.4%。


自变量:股评情绪


券商评级为卖出或中性的研报对老张选股的参考意义比买入评级更大。从图1可以看出,评级为卖出的股票,一周后不盈利的比例较大;评级为中性的股票,不盈利比例略微大于盈利比例;但评级为买入的股票,不盈利的比例和盈利的比例相近,对选股参考价值较弱。


相比之下,股吧讨论帖的标题对于选股也许更有参考意义,老张通过绘制词云 对比盈利股票和下跌股票的股吧热帖,词频分布呈现出较大差异。从图2可以看出,讨论涉及的股票成功盈利的帖子中,标题常常直接带有“大涨”、“看好”等明确情绪词汇,而图3中,讨论涉及的股票不盈利的帖子中,有消极的“退市”、“维权”等等。

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


图 1 研报评级股票表现柱状图


人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


自变量:股评影响力


在股吧,发帖人的影响力可从吧龄来衡量,图4中,各组吧龄发帖人数未有异常值,可以分组比较。图5呈现了各组股吧吧龄所讨论股票盈利比例。老张发现, 吧龄在3-5年的楼主发帖讨论的股票盈利比例最大,而吧龄在5年以上的楼主发帖讨论的股票在讨论后盈利的比例最低

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


各券商的影响力以中国证监会2019年发布的券商评级结果衡量。图6显示, 评级越低的券商,发布研报数越少。图7显示内资券商的股票盈利比例相近,而 香港券商的研究股票盈利比例较高。可能由于香港券商在选股时关注A股的龙头股、领导股较多。

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


在股吧,股评的影响力则通过阅读量体现。图8和图9可以看出, 盈利股票的股评阅读量略低,但评论数稍高。从箱体宽度可以看出,在股吧,盈利股票的发帖量更多。这可能是因为盈利股票被更多人关注。


自变量:股票情况


虽然是草根炒股,但老张早知道在创业板与主板不同。创业板上市交易的公司主要是新兴行业创新公司,更加市场化。本文研究的数据中,创业板股票中52.05%的比例盈利,而非创业板股票则有56.11%比例盈利。


小结:老张的灵感


通过以上描述性分析,老张初步判断,股票的盈利情况受到股评情绪(研报评级、股吧高频词)、股评影响力(券商等级、股吧吧龄、股吧阅读量)和股票情况(是否创业板) 的影响。作为炒股草根,老张跟着股评消息学炒股应从以上几个变量入手,老张有了灵感:


在阅读券商研报时,看到评级为买入的券商研报时别太乐观,但阅读评级为卖出和中性的研报时则要对被研究股票持谨慎态度。关注香港券商的研报跟踪的标的股票。


而在逛股吧时,关注股吧评论数较多的贴子,适当关注3-5年吧龄的楼主,但应谨慎阅读吧龄5年以上的楼主观点,若看到某只股票主题吧里充斥着消极的情绪要谨慎投资。


模型构建


老张首先决定用逻辑回归模型探究专业研报和非专业股评消息对股票涨跌的影响,在回归前,分别对被研究股票盈利/不盈利两组数据随机抽取各20%样本作为测试集,其余80%样本为训练集。用训练集进行模型回归,用测试集验证模型的外推预测能力。


(一)老张看机构研报学炒股


老张用AIC准则逐步回归选择模型变量,并综合生活经验,将研报评级、标题特征词、券商等级、券商等级与研报评级交叉项纳入模型,模型的 ROC曲线反映该模型对预测股票盈利情况几乎没有帮助,AUC仅有50.76%。比起毫无章法地猜测(50%正确率),用此模型预测股票涨跌的帮助微乎其微。


此计不成,又生一计,老张决定逛逛股吧热贴来学习炒股。

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


图10 研报对股票涨跌预测模型ROC曲线


(二)老张逛股吧热贴学炒股


老张登录股吧,发现这里可真热闹,浏览、评论、点赞,大家热火朝天地在网上交流。在提取股评文本特征词方面,老张分别选择所讨论股票盈利/不盈利这两组数据的股评文本中词频最高的动词、名词、形容词的特征词各一个作为特征词。通过AIC准则,老张选择 阅读量、评论数、发帖楼主股吧吧龄、讨论股票是否创业板、是否有特征词作为回归变量,模型的 ROC曲线反映该模型对预测股票盈利情况的预测能力较弱,AUC仅为 53.39%


老张心下一凉,看来对于专业机构研报和非专业机构股评,偏听哪方的消息都难以对预测股价涨跌产生帮助,那么能否将股吧股评和券商研报二者结合起来学习炒股呢?

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


11 股吧热贴预测股价涨跌模型ROC曲线


(三)老张将机构研报与股吧热贴结合学炒股


老张用AIC准则选择模型自变量,模型自变量 从研报和股吧中分别选择股评情绪、股评影响力变量和股票情况,具体选择研报评级、券商等级、特征词;股吧阅读数、评论数、发帖人吧龄、特征词;是否创业板。回归结果如表2所示。

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


2 研报和股吧热贴组合对股票涨跌预测模型


分析回归结果,老张发现通过股评和研报结合,可以学到选股知识。


股评情绪方面,若 专业机构的研报标题乐观情绪显眼,如相信、责任等词汇,股价盈利的概率显著减小。另外,涉及公司发布公告的研报会降低股票盈利的概率,“发布”通常用于对公司负面事项公告,如澄清公告。而分析涨停股的研报,盈利的概率显著增加,涨停股通常是领导股或成长性较好股票,其盈利的窗口期一般要比T+7更长。


非专业机构的股评情绪特征词中, 以动词潜伏”为关键词的股评显著增大股票盈利概率,潜伏底或潜伏盘通常指代还未被大多数投资者发现的优质股,但当一只股票在股吧热贴里被认定为潜伏股,那么它已经被大多数投资者发现了,股价盈利概率增加;股评中关键词包括 形容词价值”显著提高股票盈利概率,作为股评的专业词汇之一,价值通常与内在价值、市场价值、价值投资等词汇结合,往往涉及较为专业的股评。


股评影响力方面,专业机构研报中,只有 A级券商和外资券商跟踪研究的股票盈利概率显著增加,而其余等级券商跟踪研究的股票盈利概率则显著降低。这体现了不同券商的选股能力。但此变量结果可能有选择偏误,由于各家券商高质量的研报均保密,此处收集的公开数据或许未能反映券商研究真实水平。


非专业机构的股评影响力变量中, 阅读数越大的股评显著小幅降低股票盈利概率,而评论数显著提高股票盈利概率。这可能由于人们更乐于讨论行情向好的股票,而对于行情较差的股票分析较为复杂,股评难度大,大部分人持观望态度。相比于股吧吧龄1年以下的新人,吧龄在1-3年的楼主发贴所讨论的股票盈利的概率显著下降,但吧龄5年以上的老人发贴所讨论的股票盈利概率显著上升。


模型评价


模型的 ROC曲线反映了研报和股吧热贴组合模型对预测股价涨跌有帮助,且预测能力提升, AUC为62.01%

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


图12 合并预测股价涨跌模型ROC曲线


老张认为,好的选股方法能够平衡投资者的收益预期与风险承担能力, 在解读混淆矩阵时,对于只喜欢盈利的风险偏好型投资者,最重要的指标是TPR,该指标越大,投资者依据此模型选股而获得投资收益的概率越大;而 只担心亏损的风险厌恶型投资者则会更多关心FPR,该指标越小,投资者依据此模型选股不盈利的概率越小。由于老张是一个风险厌恶型的炒股草根,参考测试数据中股票盈利的观测值占到56%,老张决定以60%为阈值计算模型预测情况,产生模型混淆矩阵,如表3。老张 此次构建的模型FPR较低,但TPR不够高,更适合风险厌恶型投资者


3 股吧热贴对股票涨跌预测模型混淆矩阵

人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...


老张的结论与反思


老张通过这次探究学到了一课,股评情绪(研报评级、股吧高频词)、股评影响力(券商等级、股吧吧龄、股吧阅读量)和股票情况(是否创业板)等变量对预测中短线股票盈利情况有一定帮助。但若想通过看股评、研报等外部消息来预测股票盈利情况,一定要将专业机构的研报判断和非专业机构的股评结合起来。若偏听一方,不论只阅读研报信息还是只逛股吧消息,都对股票盈利情况预测的帮助微乎其微。


在股评情绪上,应关注专业机构研报的涨停股的盈利机会;要谨慎对待研报的乐观用词。在股吧中可以关注潜伏股的盈利机会,并且可重点关注以价值投资、内含价值等概念入手分析的股评所讨论的股票的盈利机会。


在股评影响力方面,应关注A级券商的研究标的股票的盈利机会,对于公开渠道获取的其他级别券商的研究股票谨慎对待。在股吧中,阅读数越大的股评所讨论的股票越要谨慎投资,而评论数越大的股票则盈利机会越大。


学习之后,老张在反思,结合了券商研报和股吧股评的变量构建出的模型有一定帮助,但模型整体预测能力仍然不足以让老张依赖此模型进行选股投资。另外,作为草根投资者,面对形式纷繁复杂的资本市场,只想通过股评、研报等外部消息来预测股票情况的想法过度考虑投资者预期,忽视了股票内在价值,与传统的股票投资理论相悖。未来可对模型做两方面改进,一是对文本变量分析更细化,二是加入财务变量,以期提高模型的预测能力。股民老张放下笔,决定学习高阶的《文本分析方法》和《财务会计》。



人才计划第4期作品| 股民老张听消息学炒股——基于机构研报和股民... ...



在狗熊会人才计划,


每次作业都以实际业务问题为背景,


并有老师认真批改,


有效提升我的数据分析和报告撰写能力。


感谢老师和助教们的辛勤付出!



鲜花

握手

雷人

路过

鸡蛋
分享到:
更多

最新文章

股票最有效最简单最牛的选股方法
股票最有效最简单最牛的选股方法
不管什么市场,业绩好是推动股价上涨的基本因素。所以选股时尽量选择每股税后利润0.4元以上...
炒股看k线有用吗?怎么看股票K线进行炒股?
炒股看k线有用吗?怎么看股票K线进行炒股?
股市的K线图中往往包含着丰富的信息,通过对这些信息的分析,有助于我们判断股价的走势。下...
在股市收盘前黄金半小时应该做些什么
在股市收盘前黄金半小时应该做些什么
每天下午2:30是一天投资的最关键时间。一天的交易集中在半小时内,这称为“两个半黄金小时...
炒股新手蜕变成高手的过程
炒股新手蜕变成高手的过程
某只股票从高位跌落后,如果连续三天没有收出5天均线,最好的办法是,在还没有严重"损手断...
这些股票卖出技巧你知道几个?炒股高手都在用
这些股票卖出技巧你知道几个?炒股高手都在
​证券市场实战中,并非所有股票的涨跌都有规律可寻,以下十八种情形可供卖出参考:该股在...
什么是博傻理论?它在炒股中起到什么样的作用?
什么是博傻理论?它在炒股中起到什么样的作
炒股,博傻理论有时会在消息面因素的推动下变得更强。举例来说,某强势股日复一日地上涨,...
返回顶部