格上每日收评—2025年09月23日
每日收评
2025-09-23
2.16k人浏览
摘要:今日A股震荡调整,创业板指领跌。DeepSeek今日启动开源周首个开源代码库为FlashMLA
格上每日收评—2025年02月24日
00:00
00:00
×1
今日市场
今日A股震荡调整,创业板指领跌。总体上涨多跌少,全市超2778只个股上涨,沪深两市全天成交额达到20804亿元,较上周五缩量1122亿。盘面上,31个申万一级行业中有17个行业上涨,其中建筑装饰、建筑材料、房地产行业领涨,通信、医药生物、传煤行业领跌。消息面上,2月24日,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东发布视频,正式预告华为将于3月发布首款为原生鸿蒙而生的新形态手机。
截至收盘,今日上证指数收于3373.03点,下跌0.18%,成交额为8028亿元;深证成指下跌0.08%,成交额为1.10万亿元;创业板指下跌0.67%。今日两市上涨个股数量为2778只,下跌个股数为2468只。
从风格指数上来看,今日各风格表现不一,其中稳定风格的个股表现最好,金融风格的个股表现最弱。近期风格转换较为明显。
盘面上,31个申万一级行业中有17个行业上涨,其中建筑装饰、建筑材料、房地产行业领涨,涨幅分别为2.34%,1.76%,1.66%。通信、医药生物、传媒行业领跌,跌幅分别为1.10%,0.90%,0.81%。
从风险溢价指数来看,风险溢价率在历史上处于均值+1倍标准差之上时,A股往往处于底部区域。目前风险溢价率为3.56%,接近一倍标准差,万得全A指数处于底部阶段。风险溢价指数近期震荡,市场情绪回落。后期市场仍有扰动,但下行空间相对可控,建议投资者择机分批布局。
(注:数据更新至前一交易日,风险溢价率越大,表明配置股票的性价比越高;反之,则配置债券的性价比越高)
热点新闻
新闻一:DeepSeek今日启动开源周首个开源代码库为FlashMLA
2月24日,DeepSeek启动“开源周”,首个开源的代码库为FlashMLA——针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计。据介绍,FlashMLA的灵感来自FlashAttention 2&3和cutlass项目。
其发布有以下几个重点内容:
FlashMLA是DeepSeek针对HopperGPU优化的高效型MLA(Multi-HeadLatentAttention,多头潜在注意力)解码内核,专为处理可变长度序列设计,已在生产环境中投入使用。
此项目是DeepSeek V2–V3系列大模型的重要技术创新,旨在通过优化解码过程和KV缓存来降低大语言模型的推理成本,同时提升响应速度和吞吐量。
FlashMLA在英伟达H800 SXM5 GPU上测试时,能够达到3000GB/s的内存带宽和580TFLOPS的计算上限,这显示出在内存访问和计算效率上的显著优势。
目前发布的版本支持BF16精度,并采用块大小为64的分页KV缓存,确保在处理大模型推理任务时更加高效。
官方指出,FlashMLA的设计灵感部分来源于FlashAttention2&3以及英伟达的CUTLASS项目,这表明该解码核在高效注意力计算方面进行了针对性优化。
通过采用低秩分解等技术,FlashMLA在压缩KVCache的同时仍保证了原有性能,能够在降低内存需求的同时提升推理效率。
FlashMLA特别适用于需要处理长序列文本的应用,如聊天机器人、文档分析以及实时翻译系统,能显著降低延迟和资源占用。
随着该项目开源,未来有望集成到vLLM、Hugging Face Transformers或Llama.cpp等开源生态系统中,使得更多大语言模型(如LLaMA、Mistral、Falcon)能在相同硬件资源下获得更高效的推理性能。
发布的代码中包含内联PTX代码,这种做法使得开发者可以更精细地控制GPU执行流程,进一步提升计算性能,并可能部分绕开英伟达封闭生态的限制。
上周四,DeepSeek宣布在这周举办“开源周”活动,并开源五个代码库。
DeepSeek表示以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁,进一步分享新的进展,并将这一计划定义为“Open Source Week”。DeepSeek表示,其在线服务中的构建模块已经被记录、部署并进行了实际测试,希望分享的每一行代码都会变成强有力的势能,加速行业发展进程。该团队还称,这个领域没有象牙塔,只有纯粹的车库创业精神与社区共筑的创新力量。
市场有风险,投资需谨慎。本内容表述仅供参考,不构成对任何人的投资建议。
格上研究
最新资讯