0%

我们知道,在电脑上删除文件时,并不会真的删除数据,而仅仅是在文件系统中将相应文件的索引删除。哪怕是格式化,在「快速格式化」的情况下,也不会删除磁盘上的数据。这种删除/格式化的操作,有歹心的人是有可能恢复数据的。

因此,在某些情况下——例如归还借用的电脑时——我们会希望能够真正地「粉碎」文件,避免被人恢复敏感数据。

市面上有不少「粉碎文件」的工具。但:

  • 为了信息安全这件事情,专门安装第三方工具,这件事情本身就很吊诡;
  • 如果要粉碎大量文件,同时保证全盘没有遗漏,这些第三方工具往往不可靠。

这篇介绍用 Windows 自带的工具解决这个问题。

阅读全文 »

FTRL 是 Follow The Regularized Leader 的缩写,它是 Google 在 2010 -- 2013 年三年时间内,从理论研究到实际工程化实现的在线优化算法框架。FTRL 在处理带 $L_1$ 正则化的逻辑回归类模型时,效果非常出色:能够得到性能较好的稀疏解。

中文网络上,已有一些关于 FTRL 的介绍。比较详细和出名的是新浪微博的冯扬撰写的「在线最优化求解」。但在我看来,已有的关于 FTRL 的介绍,都或多或少有些值得调整和改进的地方。这促成了这篇文章。

这篇文章讲 FTRL 的理论部分,大致会按照这样的路径来阐述:

  • 我们想要解决什么问题?
  • FTRL 的前辈们是怎么尝试解决问题的?
  • 前辈们之间是什么关系?又留下了哪些尚未解决的问题?FTRL 是如何解决这些遗留问题的?

而后,在下一篇工程部分的文章中,我们会讨论一下 FTRL 的工程实现有哪些值得谈一谈的问题。

阅读全文 »

今天 @Butui Hu 在群里问了一个老问题:怎么在 Beamer 的 frame 当中使用 minted 环境?

这个问题的答案很简单:其实不论是 minted 还是 lstlisting 还是基本的 verbatim,这些「抄录」环境与 frame 联用时,统统都需要给 frame 加上 fragile 参数,形如:

1
2
3
\begin{frame}[fragile]
% verbatim-like environment.
\end{frame}

但问题是,为啥事情会变成这个样子?这篇文章简单讨论一下。

阅读全文 »

昨天正在训练线上模型的机器被人误操作,不得不重做系统。万幸模型相关的训练状态保存在另一块磁盘上,没有受到影响。要想恢复训练状态相关数据,就必须把磁盘挂载好。因为这个操作不常用,一时居然都没想起来怎么做。因此这里「烂笔头」记录下来。

阅读全文 »