一種基于四分位圖展示數據的可視化方法及系統的制作方法
【專利摘要】本發明提供一種基于四分位圖展示數據的可視化方法,該方法包括:定義數據格Gx,并確定X軸的展示刻度步驟;進行數據源配置、掃描和讀取步驟;分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位步驟;采用四分位圖進行數據展示步驟。本發明通過定義數據格Gx來存儲數據,并且X軸的四種展示刻度間相互切換,采用四分位圖來展示數據,實現在數據量巨大或大數據環境下展示二維數據的分布情況,并提供交互功能。另外,本發明還提供一種基于四分位圖展示數據的可視化系統。
【專利說明】—種基于四分位圖展示數據的可視化方法及系統
【技術領域】
[0001]本發明涉及數據處理領域,尤其涉及一種基于四分位圖展示數據的可視化方法及系統。
【背景技術】
[0002]四分位圖是一種展示一維數據分布情況的圖形,能直觀表現出數據的分布形態,包括五個數據點:最低位、四分之一位、中值位、四分之三位、最高位。其中最低位、最高位分別對應最小值、最大值,四分之一位含義為所有數據中有25%的數據小于該值,同理中值位為所有數據中有50%小于該值,四分之三位為所有數據中有75%小于該值。四分位圖只是個展示工具,且只能用來展示一維數據分布情況。因而缺少一種采用四分位圖展示二維數據分布情況的可視化方法。
【發明內容】
[0003]因此,本發明為了解決上述缺陷之一。
[0004]因而,本發明提供一種基于四分位圖展示數據的可視化方法及系統,本發明通過定義數據格Gx來存儲數據,并且X軸的四種展示刻度間相互切換,采用四分位圖來展示數據,實現在數據量巨大或大數據環境下展示二維數據的分布情況,并提供交互功能。
[0005]所以,本發明一個實施例提供一種基于四分位圖展示數據的可視化方法,該方法包括:
定義數據格Gx,并確定X軸的展示刻度步驟;
進行數據源配置、掃描和讀取步驟;
分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位步驟;
采用四分位圖進行數據展示步驟。
[0006]在本發明一個實施例中,所述定義數據格Gx,并確定X軸的展示刻度步驟包括:計算自變量X的取值范圍,并對自變量X進行離散化。
[0007]在本發明一個實施例中,所述定義數據格Gx,并確定X軸的展示刻度步驟還包括:根據自變量X的取值范圍對X的最大和最小值進行調整,進而將所述取值范圍劃分成一系列等分的Gx。
[0008]優選地,所述展示刻度為4種,并可相互進行切換。
[0009]在本發明一個實施例中,所述進行數據源配置、掃描和讀取步驟包括:
依據自變量X和因變量Y進行數據源配置;
獲取自變量X的最小值和最大值,依據取值區間對最大值和最小值進行修正;
掃描數據源,讀取每一記錄的X與Y值:X和y,并計算出X和I對應的數據格GX,將所述數據保存到該Gx中。
[0010]優選地,所述計算每一刻度級別的每一數據格Gx內數據的四分位包括:最低位、四分之一位、中值位、四分之三位和最高位。
[0011]在本發明一個實施例中,所述采用四分位圖進行數據展示步驟包括:所述采用四分位圖進行數據展示的數據為數據格Gx中存儲的數據。
[0012]優選地,所述采用四分位圖進行數據展示步驟還包括:所述展示可進行上限或下限單方向修改和范圍整體拖動。
[0013]優選地,所述采用四分位圖進行數據展示步驟還包括:
所述展示可選擇一片區域進行,所述展示為對應數據格Gx內詳細信息。
[0014]本發明另一個實施例提供一種基于四分位圖展示大數據的可視化系統,該系統包括:數據格定義單元,用于定義數據格Gx,并確定X軸的展示刻度;數據源獲取單元,用于進行數據源配置、掃描和讀取;數據源存儲單元,用于分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位;數據展示單元,用于采用四分位圖進行數據展示。
[0015]所述數據源獲取單元根據數據格定義單元確定的自變量X的最小值和最大值,依據取值區間對最大值和最小值進行修正,并掃描數據源,讀取每一記錄的X與Y值:X和y,計算出X和y對應的數據格Gx。所述數據展示單元展示的數據為數據源存儲單元存儲的數據格Gx內的數據。
【專利附圖】
【附圖說明】
[0016]圖1是本發明一個實施例提供的一種基于四分位圖展示數據的可視化方法的具體流程示意圖。
[0017]圖2是本發明一個實施例中定義的數據格Gx的示意圖。
【具體實施方式】
[0018]為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步的詳細說明。應當理解,此處所描述的具體實施例僅僅用于解釋本發明,并不用于限定本發明。
[0019]本發明提供一種基于散點圖展示數據的可視化方法及系統,本發明通過定義數據格Gxy來存儲數據,并利用散點圖來展示數據,實現了在數據量巨大情況下的數據展示的可視化,可用于數據展示和數據分析。
[0020]如圖1是本發明一個實施例提供一種基于四分位圖展示數據的可視化方法具體流程示意圖,具體為以下步驟:
步驟SllO:定義數據格Gx,并確定X軸的展示刻度。
[0021]在本發明一個實施例中,為了展示二維四分位圖需要先計算自變量X的取值范圍,并對自變量X進行離散化。并根據自變量X的取值范圍對X的最大和最小值進行調整,進而將所述取值范圍劃分成一系列等分的Gx。如圖2所示對數據格Gx作如下定義:
Gx{xl,x2}為 G{ (X,y) I xl〈=x〈x2},簡稱 Gx,即所有滿足 xl〈=x〈x2 的點(x, y)。
[0022]步驟S120:進行數據源配置、掃描和讀取。
[0023]該步驟中,數據源依據自變量X和因變量Y進行數據源配置,并獲取自變量X的最小值和最大值,依據取值區間對最大值和最小值進行修正,使得最小值、最大值為10的η次方(η為整數)的倍數,即Xmin (或Xmax) = m * 10~n。如X的實際取值區間為[0.1,983.7],進行修整后X的最小值為O,最大值為1000,即取值區間變為:[0,1000]。依據修正后的X軸取值區間劃分成一系列等距的Gx,Gx的間距刻度Sx將會動態的識別成10的η次方(η為整數),即s=10~n,可能的取值為1、10、100、1000000、0.1,0.01等。同時為了支持縮放功能,本系統將同時支持3種Gx展示刻度,并支持切換(η連續,每切換一次,對應的將放大、縮小10倍)。4種Gx展示刻度將動態識別,識別的標準為使得最大展示刻度時X軸被等分成10-100個Gx,如X數據的分布區間為O到50000,那么本系統支持的Gx的展示刻度將為:
1、10、100、1000。
[0024]掃描數據源,讀取每一記錄的X、Y值χ和y,并計算出χ和y對應的數據格Gx,將所述數據保存到該Gx中。如x=155.3且X軸刻度為“10”時,155.3/10 = 15.53,則Gx為Gx {150, 160},當刻度為 I 時則屬于 Gx {155,156}。
[0025]步驟S130:分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位。
[0026]讀取數據完畢后,分析存儲的數據,修正X軸展示刻度,如果某個小級別的刻度中有效的Gx數量(Gx中記錄數大于O則稱該Gx有效)小于上級的有效Gx數量的2倍,則刪除該刻度。刪除該刻度的原因是當放大到該級別時,信息增加的并不多,實際數據明細并沒有得到有效的放大。確定保留的有效展示刻度中最大的為初始展示的刻度。所述計算每一刻度級別的每一數據格Gx內數據的四分位包括:最低位、四分之一位、中值位、四分之三位和最聞位。
[0027]步驟S140:采用四分位圖進行大數據展示。
[0028]在本發明一個實施例中,所述采用四分位圖進行數據展示的數據為Gx中存儲的數據。所述展示可進行上限或下限單方向修改和范圍整體拖動。在X軸四種展示刻度間可相互進行切換,鼠標選擇四分位圖中一片區域時,可展示為對應數據格Gx內詳細信息。
[0029]本發明另一個實施例提供一種基于四分位圖展示大數據的可視化系統,該系統包括:數據格定義單元,用于定義數據格Gx,并確定X軸的展示刻度;數據源獲取單元,用于進行數據源配置、掃描和讀取;數據源存儲單元,用于分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位;數據展示單元,用于采用四分位圖進行數據展示。
[0030]所述數據源獲取單元根據數據格定義單元確定的自變量X的最小值和最大值,依據取值區間對最大值和最小值進行修正,并掃描數據源,讀取每一記錄的X、Y值X和y,計算出χ和y對應的數據格Gx。所述數據展示單元展示的數據為數據源存儲單元存儲的數據格Gx內的數據。本發明通過定義數據格Gx來存儲數據,并且X軸的四種展示刻度間相互切換,采用四分位圖來展示數據,實現在數據量巨大或大數據環境下展示二維數據的分布情況,并提供交互功能。
【權利要求】
1.一種基于四分位圖展示數據的可視化方法,其特征在于,所述方法包括: 定義數據格GX,并確定X軸的展示刻度步驟; 進行數據源配置、掃描和讀取步驟; 分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位步驟; 采用四分位圖進行數據展示步驟。
2.根據權利要求1所述的方法,其特征在于,所述定義數據格Gx,并確定X軸的展示刻度步驟包括: 計算自變量X的取值范圍,并對自變量X進行離散化。
3.根據權利要求1所述的方法,其特征在于,所述定義數據格Gx,并確定X軸的展示刻度步驟還包括: 根據自變量X的取值范圍對X的最大和最小值進行調整,進而將所述取值范圍劃分成一系列等分的Gx。
4.根據權利要求1-3任一所述的方法,其特征在于,所述展示刻度為4種,并可相互進行切換。
5.根據權利要求1所述的方法,其特征在于,所述進行數據源配置、掃描和讀取步驟包括: 依據自變量X和因變量Y進行數據源配置; 獲取自變量X的最小值和最大值,依據取值區間對最大值和最小值進行修正; 掃描數據源,讀取每一記錄的X與Y值:X和y,并計算出X和I對應的數據格GX,將所述數據保存到該Gx中。
6.根據權利要求1所述的方法,其特征在于,所述計算每一刻度級別的每一數據格Gx內數據的四分位包括:最低位、四分之一位、中值位、四分之三位和最高位。
7.根據權利要求1所述的方法,其特征在于,所述采用四分位圖進行數據展示步驟包括: 所述采用四分位圖進行數據展示的數據為Gx中存儲的數據。
8.根據權利要求1或7所述的方法,其特征在于,所述采用四分位圖進行數據展示步驟還包括: 所述展示可進行上限或下限單方向修改和范圍整體拖動。
9.根據權利要求1或7所述的方法,其特征在于,所述采用四分位圖進行數據展示步驟還包括: 所述展示可選擇一片區域進行,所述展示為對應數據格Gx內詳細信息。
10.一種基于四分位圖展示大數據的可視化系統,其特征在于,所述系統包括: 數據格定義單元,用于定義數據格Gx,并確定X軸的展示刻度; 數據源獲取單元,用于進行數據源配置、掃描和讀取; 數據源存儲單元,用于分析存儲數據與修正X軸展示刻度,進而計算每一刻度級別的每一數據格Gx內數據的四分位; 數據展示單元,用于采用四分位圖進行數據展示 。
11.根據權利要求10所述的系統,其特征在于,所述數據源獲取單元根據數據格定義單元確定的自變量X的最小值和最大值,依據取值區間對最大值和最小值進行修正,并掃描數據源,讀取每一記錄的X與Y值:χ和y,計算出X和y對應的數據格Gx。
12.根據權利要求10所述的系統,其特征在于,所述數據展示單元展示的數據為數據源存儲單元存儲的數據格Gx內的數據。
【文檔編號】G06F3/0481GK103472978SQ201310442900
【公開日】2013年12月25日 申請日期:2013年9月26日 優先權日:2013年9月26日
【發明者】王明興, 樊文飛, 賈西貝 申請人:深圳市華傲數據技術有限公司