Statistics

交叉验证(Cross-validation)

交叉验证是一种用来评价一个统计分析的结果是否可以推广到一个独立的数据集上的技术。主要用于预测,即,想要估计一个预测模型的实际应用中的准确度。它是一种统计学上将数据样本切割成较小子集的实用方法。于是可以...
阅读全文
Script

ggplot2作图详解7:主题(theme)设置

凡是和数据无关的图形设置内容理论上都可以归 主题类 但考虑到一些内容(如 坐标轴 )的特殊性,可以允许例外的情况。主题的设置相当繁琐,很容易就占用了大量的作图时间,应尽量把这些东西简化,把注意力主要放...
阅读全文
Script

ggplot2作图详解6:标尺(scale)设置

标尺是ggplot2作图必需的元素,在《映射》一节提到了它的概念并简单进行了设置。在数据分析阶段,为避免陷入数据无关的垃圾坑,我们只需要设置映射,ggplot2自动配置合适的标尺并产生坐标和图例。这是...
阅读全文
Script

ggplot2作图详解4:分面(faceting)

“facet”一词这里翻译为“分面”,不知道是否准确,可以斟酌。虽然我们前面说过ggplot2分面最终的效果是一页多图,但跟通常所说的在“一个页面中绘制多个图形”还是有区别的。ggplot2仅仅体现的...
阅读全文
Script

ggplot2作图详解3:映射(mapping)

作图前的数据准备工作不仅仅指原始数据的收集,还包括数据外观的整理,这些工作对后续的作图无疑十分重要。和其他作图方法相比,ggplot2的优点之一就是把数据整理融合到了作图过程中,替用户分担了数据整型的...
阅读全文
Script

ggplot2作图详解2:ggplot图形对象

前面我们使用qplot函数对ggplot2做图的方法进行了初步的了解,并比较了qplot和plot函数的用法。从最终得到的结果(图形)来看,除了外观不同外好像qplot函数和plot函数并没有什么本质...
阅读全文