Susie's Blog

Done is better than perfect.

HiveSQL

Yandex专项课程笔记

前言 去cad&cg实验室泡汤了,为了准备下周三下午的爱奇艺面试而准备HiveSQL。 估计去面试的不止我一个,还是要做好被刷的准备。虽然我的数据库系统概论拿了4.0,但是SQL好久不用了语法还是有点忘,而且因为没有接触过Hadoop平台,所以不知道HiveSQL和MySQL的语法有没有什么差别,于是就打开尘封已久的Coursera,注册了一门和Hive有关的课程进行学习。是Yand...

多元统计分析

方法论总结

判别分析 聚类分析 系统聚类方法 基本思想 有n个样本,每个样本有m个指标,定义样本之间的距离和类和类之间的距离。每次合并距离最近的类,重新计算类间距离,直到最后合并所有类,将过程用遗传系谱图表达出来。 步骤: 数据变换 计算样本间的距离,得到距离矩阵 初始状态,样本自己是一类 对距离矩阵,合并类间距离最小的为一类 计算新类到其他类的距离,得到新的距离矩阵 画...

实验设计期末复习

我学了点啥

一、实验设计概述 实验设计类型 演示实验 验证实验 比较实验 优化实验 实验因素数目:单因素优化、多因素优化 实验目的:指标水平优化(优化均值)、稳健性优化(减小方差) 实验形式:实物实验(现场实验、实验室实验)、计算实验 实验过程: 序贯实验(爬山法) 0.618法、分数法、因素轮换法 ...

实变函数期末复习

这可太难了

整体架构 集合与点集 集合相关概念 集合的运算 概念:对称差$\Delta$ 交换、结合、分配律 集合上极限、下极限 映射、基数与可数集 【伯恩斯坦定理】A基数B基数相等 无限集 ...

用GAN生成差分隐私数据集

一篇别人写的被拒文章

说在前面    今天看了 Generating Differentially Private Datasets Using GANS,明天要讨论。老师不知道从哪里挖出了这篇被拒了的文, 研究的主题和我们最近的工作非常相关,而且证明非常有趣,大致地看了一下文章的结构觉得没啥问题,但是看评审的comments感觉发现了不一样的视角, 但是他们差分隐私的证明还是值得梳理。可能是学科视角的原因?我一...

大作业是压力的来源

大作业压力

没写完的大作业 大作业真的分分钟让人怀疑人生。这两天和室友吐槽了很多次大作业遇到的坑爹队友。 大概我俩大学中遇到的队友类型加起来就可以集齐奇葩图鉴了。 永远消失型。 上课从来不来,作业从来不做,按理说早就挂科满20学分了,不知道为什么还没被劝退型。 暂时消失型。 明明约好了时间讨论,临时突然说有事/有ddl/直接消失,后面再说自己刚才怎么怎么了。 这种队友的性质比第一种还恶劣,...

Try for the first time

Try for the first time 我的第一篇博客 19 Apr 2019