LLM 真的是人类之光

仅举几例 这个是 GPT 3.5 版本的 User 如果我要构建一个广告的 pctr 模型,我应该一步一步完成哪些工作? ChatGPT 构建广告的pCTR(点击率)模型是一个复杂的任务,需要以下步骤: 数据收集与清理: 收集包含广告相关信息的数据,并进行清理以处理缺失值、异常值等。 特征工程: 从原始数据中提取有用的特征,例如广告内……

阅读全文

面试题之子串匹配

又到了面试季,最近问了一个问题,好像不太好答,于是自己试试 leetcode 567 https://leetcode.com/problems/… package test20190925.test20190925; import java.util.Arrays; public class SubStringCheck { public static String sortStringChar(String s) { char[] chars = s.toCharAr……

阅读全文

Presto JDBC 连接中文乱码问题

一开始以为是 jdbc 的连接上没有设置 charset encoding,但是模仿的 MySQL 的语法配置上去之后,又报错说没有这个配置项 一顿折腾,各种 string getBytes 转码,还是不行,偶然间发现同样的程序,在 Windows 上跑出来的中文不是乱码的,于是灵光一现,在 Linux 在配置了一个 export LC_ALL=zh_CN.UTF-8 就可以了

阅读全文

反编译 java class 文件

这个事情本来还以为比较麻烦,例如 c++ 里面的各种符号表啥的,想不到如此简单,看到这里, https://www.cnblogs.com/EasonJ… ,官方直接就提供了反编译的工具,去 github 上下一个 jar 包,回来直接 java -jar 命令启动起来,然后把 class 文件拖进去,就搞完了 反编译出来是 java 代码,不过翻译 scala 代码难度……

阅读全文

Win10使用Ctrl+Space切换输入法

网上各种的教程,又要改注册表,又要搞热键映射脚本啥的,都不如这个好使 https://blog.csdn.net/mvpboss1… 简单又直接,他要的效果也完全是我想要的 而且操作也简单,下载了安装就可以用了 ============ 另外,如果想禁用开始菜单中的磁贴,可以把控制面板中的在开始菜单中显示应用列表置为 on,然后把磁贴全部删……

阅读全文

Windows 微信数据迁移

当某个分区的磁盘快满的时候,可能需要对 Windows 微信的数据迁移分区,但是,用微信自带的迁移工具,在聊天记录比较大的时候,(我的是 30G 左右),可能会导致卡死 解决的方法如下: 1. 关闭微信 2. 找到原有的聊天记录 WeChat Files 文件夹下自己的微信号对应的目录 3. 使用压缩工具,将整个目录压成一个文件,这一步……

阅读全文

git lfs 报错

git clone 一个仓库的时候报错 Use `git lfs logs last` to view the log. error: external filter 'git-lfs filter-process' failed fatal: 3rd/abseil/lib64_debug/libabsl_bad_any_cast_impl.a: smudge filter lfs failed warning: Clone succeeded, but checkout failed. 报错是服务器 504 咨询了下,发现是 git 的……

阅读全文

TortoiseGit 配置

TortoiseGit 在 git pull 的时候报错,disconnected, no supported authentication methods available, server sent public key git.exe pull --progress -v --no-rebase "origin" fatal: Could not read from remote repository. Please make sure you have the correct access rights and the repository……

阅读全文

再谈 SQL 引擎

之前整理过一次,几个 hadoop 生态下 SQL 引擎的区别, https://zrj.me/archives/1868 当时稍微有点局限,都是讨论的 hadoop 生态下的,(其实那个帖子里也有不少是非 hadoop 生态的了),最新又在看这块的东西,涉及一些新的 SQL 引擎,再整理一下 主要会看以下这么几个: TiDB CockRoachDB ClickHouse Kudu + Impala ……

阅读全文

TiDB 测试报告

# 1. 背景与目标 单机 tpg 在存储和 SQL 性能上有 scale-up 上限,TiDB 作为分布式 NewSQL 的一个实现,在线性扩展,容灾等方面有架构上的优势,本次测试主要研究 TiDB 是否能满足目前运营数据服务场景下的功能和性能需求。 # 2. TiDB 系统架构 参考 https://pingcap.com/docs-cn/v3… # 3. 部署方式 4 台 TS80A 官……

阅读全文