3探索性数据可视化的最佳实践

可视化是数据科学家族中经常代表性不足的成员。 当谈到数据科学时,大多数领导者都会考虑处理大量数据,并使用复杂的算法和人工智能技术将宝藏从巨大的数字未知中解脱出来。 如果我们不花时间把分析的视觉元素组织成某种全面的格式,分析就没有什么意义。

尽管如此,领导者没有足够重视开发他们的可视化策略,特别是在探索性数据可视化方面。 如果没有一个好的探索性数据可视化程序,您可能会错过等待在数据中发现的关键洞察力。

探索性数据可视化(EDVs)是当您对数据中的哪些信息没有线索时,您组装的可视化类型。 对于这种情况,最好是雇用专门从事定性研究的数据科学家的服务-这是您的数据挖掘团队。 他们将使用适当的探索性数据分析(EDA)工具和技术来梳理你的数据,并试图提取洞察力,为进一步的研究提供方向。

在我看来,这是使用数据可视化的唯一合法业务案例。 通常,热心的数据科学从业者出于错误的原因编译数据可视化。 如果你要求一位忙碌的高管盯着一个形象(尽管它可能是优雅的),并洞察她自己的见解,这可能是一个职业限制的举动。


合适的人被邀请参加可视化聚会是那些有足够的动力和耐心在几个小时、几天甚至几周内思考你的杰作的人。 别误会,这可能是一种非常特殊的高管,但通常情况并非如此。

我相信其他数据科学家会发现花时间在你的可视化上是值得的,同行评审总是一个好主意,但那些人不会为你的研究增加最大的价值。 你必须在生意中寻找合适的人来完成你的EDA。

正确的商业伙伴是成功的EDA努力的关键。 假设您的数据科学团队拥有有效完成这一分析所需的所有能力是一个很大的错误,即使它配备了有才华的业务分析师。 这是一个值得注意的问题,所以请注意。

随着时间的推移,数据科学家应该培养对你的业务如何运作的会话理解。 很容易依赖你的数据科学团队中更有商业头脑的成员的建议,特别是在EDA期间,但不要这样做。 公司的商业专家一旦了解了他们在看什么,就能更好地解释EDV,所以一旦你的数据科学家准备好一个或多个可视化,就请他们参与。

SEE:数据湖走视觉电子表格的道路? (Z DNet)

目标是企业中的人,他们对他们的工作和你的EDA场景的情况有深入的了解,一个分析的个性或倾向,以及花时间思考你的数据科学家已经准备好的可视化。 不要浪费时间和那些不能胜任这份工作的人在一起,因为他们是可用的。

为你的目的找到最好的商业专家,并确保你的EDA努力是优先使用他们的领导。 最后,不要强迫非分析人员进行分析;他们将消耗数据科学工件-他们需要分析。

在你组装了你的定性数据科学家,开始你的EDA工作,并瞄准合适的商业专家进行合作后,就不会很久,魔术就开始了。 如果你的数据科学家有正确的工具来快速收集和清理数据,他们应该准备好在不久之前组装可视化。 以下是我构建这些可视化的最佳做法。

SEE:开始使用Python:免费资源列表(免费PD F)(技术共和国)

探索性数据可视化是数据科学中令人兴奋的一部分。 EDA数据科学家通过发现隐藏在你的数据中的信息珠宝而茁壮成长。 通过与你最好的商业专家合作,让他们——以及你们自己——获得巨大成功。

您应该使用本文中提出的协作EDV技术来揭示关键假设,由您的定量数据科学家进行测试。 定量研究的定性前兆对于从你的数据科学计划中提取最大的价值是至关重要的,有了正确的EDV,你就可以可视化你的视野。


郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢