您现在的位置是:首页 > 技术教程 正文

[240607] Jina AI 发布多模态嵌入模型 | PHP 曝新漏洞 | TypeScript 5.5 RC 发布公告

admin 阅读: 2024-06-07
后台-插件-广告管理-内容页头部广告(手机)

Jina AI 多模态嵌入模型 - jina-clip-v1

jina-clip-v1 是 Jina AI 最新推出的多模态嵌入模型。与 OpenAI CLIP 相比,它大幅提升了纯文本检索方面的性能,同时在文本图像跨模式检索等方面也有所提升。

  1. 模型信息:

    • jina-clip-v1 沿用了 OpenAI CLIP 的模式: 共同训练文本和图像模型并在同一嵌入空间中生成输出。
    • 在文本编码方面,它采用了 Jina BERT v2 架构,该架构能支持 8k token 输入和 768 维向量输出,比 OpenAI CLIP 模型支持的 77 token 输入要高 100 多倍。
    • 在图像嵌入方面,它使用了北京人工智能研究院的 EVA-02 模型。在实际测试中,该模型的表现明显优于其他同类模型。
    • 在模型训练方面,Jina 采用新的多任务对比训练方法来训练 jina-clip-v1 模型。
  2. 性能评估:

    ModelText-TextText-to-ImageImage-to-TextImage-Image
    jina-clip-v10.4290.8990.8030.916
    openai-clip-vit-b160.1620.8810.7560.816
    vs OpenAI CLIP165%2%6%12%
  3. 价格:
    文本和图像的输入均按 token 消耗收费。对于英文文本,平均每个单词需要 1.1 token。对于图像,平均每张 750x500 像素的图片需要 12000 token(具体的计算细节请参考 Jina 官方)。

  4. 使用方法:

    • 下载模型: jina-clip-v1 模型已开源,可以在 Hugging Face 上免费获取,其开源协议为 Apache 2.0。
    • API: 支持通过 Jina Embeddings API 将 jina-clip-v1 集成到你的应用程序中。
    • LLM 框架: jina-clip-v1 已集成到 LlamaIndex 和 LangChain。
  5. 支持的语言: 目前仅支持英语,下一步计划支持德语和中文。

PHP 漏洞 CVE-2024-4577

CVE-2024-4577:PHP CGI 参数注入漏洞摘要

漏洞描述:

  • PHP 在 Windows 操作系统上的编码转换实现中存在缺陷,攻击者可利用此缺陷绕过 CVE-2012-1823 的防护措施。
  • 攻击者可通过构造特殊的字符序列,向远程 PHP 服务器发起参数注入攻击,最终导致任意代码执行。

受影响版本:

  • PHP 8.3 < 8.3.8
  • PHP 8.2 < 8.2.20
  • PHP 8.1 < 8.1.29
  • 所有安装在 Windows 操作系统上的 PHP 版本

漏洞影响:

  • 攻击者可在受影响的服务器上远程执行任意代码。
  • 默认情况下,所有版本的 XAMPP for Windows 安装都容易受到攻击。
  • 漏洞利用的难易程度取决于 Windows 操作系统的语言环境,已知在繁体中文、简体中文和日语环境下可直接执行任意代码。

缓解措施:

  • 强烈建议所有用户升级到最新版本的 PHP:8.3.8、8.2.20 和 8.1.29。
  • 对于无法升级的系统,可参考文章中提供的临时缓解措施,例如使用 Rewrite Rules 阻止攻击。
  • 建议评估将 PHP CGI 架构迁移到更安全的架构,例如 Mod-PHP、FastCGI 或 PHP-FPM。

其他信息:

  • DEVCORE 已将该漏洞报告给 PHP 官方团队,并于 2024 年 6 月 6 日发布了修复补丁。
  • 文章中提供了详细的技术细节、漏洞利用场景、缓解措施和时间线等信息。

数据支撑:

以上文章采用 Gemini Pro 1.5 生成摘要,命令如下:

x jina r 'https://devco.re/blog/2024/06/06/security-alert-cve-2024-4577-php-cgi-argument-injection-vulnerability-en/' | \
  @gemini -t 0 '以大纲方式生成一份摘要,列举更多的数据支撑,用中文'

TypeScript 5.5 RC 发布公告

主要更新:

  • 类型推断改进
    • 自动推断类型谓词,例如 xxx is number,以获得更精确的推断签名。
    • 优化常量索引访问类型判断,例如当 obj 和 key 都是常量时,TypeScript 能够更精准判断 obj[key] 的类型。
    • 优化变量追踪类型变化的准确性,例如数组使用 .filter 显示过滤后,TypeScript 能够更准确地推断出数组类型。
  • JSDoc 类型导入
    • 支持使用 @import 语法在 JSDoc 中导入类型,方便开发者在 JavaScript 文件中直接导入类型,开启类型检查。
  • 正则表达式基本语法检查
    • 新增对正则表达式语法的基本检查,例如捕获组引用错误。
  • 支持 ECMAScript Set 新函数的类型声明
    • 支持 Set 类型函数的类型推断,如 unionintersectionisSubsetOf 等。
  • 隔离声明
    • 新增 --isolatedDeclarations 选项,可从源文件自动生成库和模块轻量级类型签名。
  • 其他改进:
    • 新增 ${configDir} 模板变量,用于在配置文件 tsconfig.json 中使用相对路径,这使得跨项目共享配置文件变得更加容易,并确保配置文件更加可移植。
    • 在生成声明文件时,会参考 package.json 中的依赖关系。
    • 编辑器和监听模式的可靠性改进。
    • 性能和体积优化。
    • 更方便地从 ECMAScript 模块中使用 API。
    • 新增 transpileDeclaration API,用于编译生成单个 TypeScript 文件。

来源:
devblogs.microsoft.com/typescript/…


更多内容请查阅 : blog-240607


关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法

标签:
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

在线投稿:投稿 站长QQ:1888636

后台-插件-广告管理-内容页尾部广告(手机)
关注我们

扫一扫关注我们,了解最新精彩内容

搜索