1. <rp id="zsypk"></rp>

      2. 血緣關(guān)系數(shù)據(jù)的分析論文

        時(shí)間:2021-06-11 13:36:59 論文 我要投稿

        血緣關(guān)系數(shù)據(jù)的分析論文

          血緣關(guān)系數(shù)據(jù)的分析論文

          1依托血緣分析的數(shù)據(jù)熵減

        血緣關(guān)系數(shù)據(jù)的分析論文

          對(duì)于使用數(shù)據(jù)的動(dòng)機(jī),除了對(duì)數(shù)據(jù)對(duì)象主體的認(rèn)知識(shí)別之外,還有要對(duì)數(shù)據(jù)呈現(xiàn)的顯性和隱性規(guī)律進(jìn)行發(fā)現(xiàn),從自然語(yǔ)言上看,腦力活動(dòng)對(duì)數(shù)據(jù)處理的第一步就是降低數(shù)據(jù)間的差異化,進(jìn)行熵減的分析行為。哲學(xué)家維特根斯坦認(rèn)為,對(duì)于哲學(xué)本質(zhì)的界定都屬無(wú)法言說(shuō)之物,應(yīng)用到數(shù)據(jù)分析領(lǐng)域,數(shù)據(jù)存在一種由內(nèi)而外的泛化慣性,不斷對(duì)原有數(shù)據(jù)形成新的描述,造成數(shù)據(jù)陣營(yíng)的擴(kuò)張,而其信息主體則是穩(wěn)定的,對(duì)描述性數(shù)據(jù)和活動(dòng)數(shù)據(jù)存在吸附力,屬于無(wú)法言說(shuō)的本質(zhì)最邊緣。立足于這種思想觀點(diǎn),我們可以認(rèn)為貌似松散無(wú)序的數(shù)據(jù)間存在一種牢固的血緣數(shù)據(jù)關(guān)系,因?yàn)樗袛?shù)據(jù)都是基于信息主體泛化出的描述性和活動(dòng)性數(shù)據(jù),而這種熵減的動(dòng)作其表現(xiàn)形式可以等同于對(duì)數(shù)據(jù)血緣關(guān)系的向上追溯,技術(shù)上則表現(xiàn)為一種尋找最大扇出的上層。這樣,熵減的技術(shù)實(shí)現(xiàn)就是通過(guò)建立血緣關(guān)系而去尋找最大扇出的上層,這種分析法易于在數(shù)據(jù)發(fā)現(xiàn)應(yīng)用中,通過(guò)檢索建立模糊入口點(diǎn)去組織發(fā)現(xiàn)數(shù)據(jù),其與扇出或扇入點(diǎn)的血緣關(guān)系越近,入口點(diǎn)對(duì)其的吸附力越強(qiáng)、權(quán)重越高。但這樣會(huì)出現(xiàn)另一個(gè)無(wú)法回避的問(wèn)題,即通過(guò)活動(dòng)在最外界的數(shù)據(jù)從體量上看相當(dāng)可觀,由外到內(nèi)追溯扇出上層的勞動(dòng)比較沉重,從而會(huì)理所當(dāng)然地采取抽樣的方式進(jìn)行,此項(xiàng)活動(dòng)的進(jìn)行必須假定數(shù)據(jù)世界觀上層的有限集合認(rèn)定上,堅(jiān)信必定會(huì)將血緣關(guān)系歸集到某幾個(gè)關(guān)鍵數(shù)據(jù)表達(dá)之上,這樣才會(huì)使本項(xiàng)活動(dòng)的實(shí)施行為具備基本的意義和價(jià)值。從效果上看,對(duì)數(shù)據(jù)進(jìn)行熵減有利于我們甄別數(shù)據(jù)關(guān)系隱含的內(nèi)在規(guī)律,也有利于我們建立具有良好適應(yīng)性的數(shù)據(jù)生態(tài)模型,為更好地認(rèn)識(shí)和利用數(shù)據(jù)打下基礎(chǔ)?梢院侠頃诚胍幌,當(dāng)我們就一個(gè)焦點(diǎn)議題開(kāi)展討論后,熵減讓我們迅速聚焦到議題的內(nèi)核,甚至直面議題背后隱含的現(xiàn)象實(shí)質(zhì),不必糾纏于不必要的信息干擾,對(duì)討論內(nèi)核進(jìn)行強(qiáng)化呈現(xiàn),智力活動(dòng)所崇尚的方式也可以在計(jì)算活動(dòng)中得以體現(xiàn)。熵減在某種意義上不是對(duì)某一類數(shù)據(jù)分析所采取的手段,而是對(duì)數(shù)據(jù)認(rèn)識(shí)的宏觀行為,其在計(jì)算領(lǐng)域內(nèi)的呈現(xiàn)方式,與我們對(duì)事物自然認(rèn)知而采取的抽象和引申別無(wú)二致,如此深入下來(lái),對(duì)熵減策略的研究更重要于對(duì)熵減活動(dòng)的歸納,通過(guò)對(duì)策略模型的推演,可以有效地發(fā)揮機(jī)器學(xué)習(xí)的能力,如果在策略模型的'研究上實(shí)施開(kāi)展,將會(huì)極大降低加工難度。

          2建立標(biāo)簽關(guān)系的反向工程

          當(dāng)我們框定了熵減的方法體系后,在數(shù)據(jù)間建立血緣關(guān)系則顯得尤為重要,由于數(shù)據(jù)生長(zhǎng)動(dòng)力呈現(xiàn)由內(nèi)而外的泛化驅(qū)動(dòng),但是本身這種泛化在信息化過(guò)程中很多是無(wú)組織的行為,缺少邏輯上預(yù)先定義,所以數(shù)據(jù)生成后,大量的數(shù)據(jù)關(guān)系被衰減掉,從正向渠道難以對(duì)數(shù)據(jù)關(guān)系建立血緣,工程極其浩瀚復(fù)雜。由于血緣關(guān)系無(wú)法完全在數(shù)據(jù)生長(zhǎng)中自然形成,正向人工干預(yù)又存在操作難度,所以反其道而行之則是唯一通道。數(shù)據(jù)加工的反向性,優(yōu)勢(shì)首先體現(xiàn)在由微觀到宏觀的加工難度大幅下降,因?yàn)槠涔ぷ魈幱诔橄蟮淖畹讓,使采用眾包模式加工成為可能。其次,這種加工模式,可以在有效建立一種數(shù)據(jù)關(guān)系的閉環(huán)管理的同時(shí),不會(huì)抑制數(shù)據(jù)生長(zhǎng)的空間和速率,不會(huì)因加工效率低而凝固數(shù)據(jù)資產(chǎn)化的進(jìn)程。在反向加工的過(guò)程中,需要通過(guò)標(biāo)簽聯(lián)結(jié)數(shù)據(jù)關(guān)系,這時(shí)候我們要關(guān)注標(biāo)簽的質(zhì)量和復(fù)用度,由于標(biāo)簽定義存在難度,所以要松綁標(biāo)簽定義來(lái)促成數(shù)據(jù)加工的快速實(shí)施,解決的重點(diǎn)則遷移到標(biāo)簽在后期管理中的智能化上。首先,可以通過(guò)標(biāo)簽在關(guān)系聯(lián)結(jié)中的重復(fù)出現(xiàn)進(jìn)行跟蹤,識(shí)別是標(biāo)簽二義性還是加工者的活動(dòng)差異;顒(dòng)差異標(biāo)簽最基本的處理方法是進(jìn)行聚合,形成知識(shí)歸納;二義標(biāo)簽則需要改進(jìn)表達(dá)。其次,依賴血緣關(guān)系建立可視化圖譜,從數(shù)據(jù)結(jié)構(gòu)工程里可以有效識(shí)別關(guān)系路徑的黏合點(diǎn),即發(fā)現(xiàn)重復(fù)路徑中出現(xiàn)的一個(gè)以上的標(biāo)簽,消除由知識(shí)結(jié)構(gòu)差異造成的人為誤會(huì),對(duì)標(biāo)簽進(jìn)行合并。這樣,通過(guò)標(biāo)簽的智能化后期管理就可以將加工難度上移,建立分層加工的工廠模式。這種加工存在基本準(zhǔn)則,并要建立基本的衡量尺度來(lái)保證標(biāo)簽有效性,加工工藝可以從標(biāo)簽質(zhì)量、使用度、命中率等指標(biāo)進(jìn)行測(cè)量。其中,質(zhì)量有賴于標(biāo)簽本身定義成分的內(nèi)涵,要確認(rèn)其被受眾廣泛理解;使用度是在加工活動(dòng)中的使用次數(shù),是否被數(shù)據(jù)關(guān)系廣泛應(yīng)用,使用度較低的標(biāo)簽要確認(rèn)其存在價(jià)值,通過(guò)標(biāo)簽間同時(shí)出現(xiàn)概率決定其含義表達(dá)是否具備唯一性;命中率則建立在使用者的自然需要基礎(chǔ)上,如果某一標(biāo)簽絕少被使用者利用或調(diào)度,與整體觀測(cè)結(jié)果是否存在數(shù)值上的明顯差異。整體上看,通過(guò)這些基本準(zhǔn)則建立標(biāo)簽管理的異常檢測(cè)分析,來(lái)保證加工質(zhì)量的方式具備技術(shù)的可行性,但同時(shí)更需要對(duì)后期的數(shù)據(jù)運(yùn)行建立領(lǐng)域指標(biāo)模型來(lái)校驗(yàn)。

          3利用詞條原子化推導(dǎo)入口點(diǎn)

          擺脫了數(shù)據(jù)關(guān)系組織有效到達(dá)的困境,就面臨著人機(jī)操作中難度所在的入口點(diǎn)識(shí)別問(wèn)題。不可回避的是,在數(shù)據(jù)發(fā)現(xiàn)和信息提取過(guò)程中,存在根深蒂固的操作者對(duì)自然認(rèn)知的表達(dá)差異,同樣的數(shù)據(jù)訴求在不同操作者中提供的信息接口是多樣化的。先從系統(tǒng)方向看,數(shù)據(jù)在延伸過(guò)程中越到生長(zhǎng)關(guān)系的末端,越體現(xiàn)其高度領(lǐng)域化的特征,而處于頂端的數(shù)據(jù)則呈現(xiàn)出樸素原始的特征。再?gòu)牟僮髡叻较蛏峡,?duì)數(shù)據(jù)發(fā)現(xiàn)的訴求來(lái)源于操作者對(duì)訴求數(shù)據(jù)產(chǎn)生的邏輯意識(shí)活動(dòng)結(jié)果與其位置的可能性預(yù)期,從而出現(xiàn)輸入信息的參差不齊,呈現(xiàn)或概括、或空泛、或簡(jiǎn)單、或?qū)I(yè)的表現(xiàn)形式。而作為人機(jī)交互這種兩個(gè)世界的重要對(duì)話,應(yīng)盡量保持其信息輸入兩界的對(duì)稱性,做出邏輯處理相應(yīng)的努力。由上所述,系統(tǒng)邊界的數(shù)據(jù)宏觀上呈領(lǐng)域和樸素這種兩極分布,與之相映成趣的操作者邊界也是這樣,在某種程度上,分析模型建立就是要對(duì)操作者和系統(tǒng)間達(dá)成高度一致。另外,信息輸入詞條的原子化,重要依賴途徑是詞庫(kù)的建設(shè),詞庫(kù)的豐歉決定了原子化能力和詞條準(zhǔn)度,很難想象一個(gè)低級(jí)詞庫(kù)在操作者允許其機(jī)器學(xué)習(xí)前的表現(xiàn),其應(yīng)用體驗(yàn)是不堪一擊的。作為人機(jī)交互的擺渡機(jī)制,詞庫(kù)建設(shè)必須承擔(dān)相應(yīng)的任務(wù),依賴人機(jī)邊界的極化特征建立基礎(chǔ)和專業(yè)的極化詞庫(kù)。同時(shí),不能將詞庫(kù)建設(shè)看做是畢其功于一役的建設(shè)模式,要充分利用在血緣關(guān)系中數(shù)據(jù)加工活動(dòng)形成的知識(shí)歸納,建立基于血緣關(guān)系的分析模型運(yùn)行生態(tài)。有鑒于此,努力嘗試建立的數(shù)據(jù)分析方法,其實(shí)也是提升對(duì)混沌數(shù)據(jù)的認(rèn)識(shí)能力,數(shù)據(jù)在運(yùn)行周期內(nèi)存在某一臨界點(diǎn),存在急速生長(zhǎng)的非線性事件,使得數(shù)據(jù)急劇膨脹,血緣數(shù)據(jù)關(guān)系的建立,則在另一維度上對(duì)數(shù)據(jù)體量的不穩(wěn)定進(jìn)行調(diào)和,使其在關(guān)系譜圖上存在規(guī)律和一定的容積,可以允許我們進(jìn)行更具效率的水平觀測(cè)和定位能力。這樣的話,數(shù)據(jù)生長(zhǎng)的臨界水平在血緣關(guān)系維度上轉(zhuǎn)而呈現(xiàn)線性,不會(huì)使得該種數(shù)據(jù)分析方法在臨界點(diǎn)出現(xiàn)隨機(jī)事件,造成大量的數(shù)據(jù)擁堵和執(zhí)行效率低下,防止系統(tǒng)坍塌。從信息安全角度,我們也可以有效剝離關(guān)系模型和數(shù)據(jù)實(shí)體,使得基于關(guān)系認(rèn)識(shí)上的分析模型脫離數(shù)據(jù)集本身,防止數(shù)據(jù)對(duì)上層模型的浸透,有效緩解了數(shù)據(jù)開(kāi)放性過(guò)強(qiáng)帶來(lái)的安全隱患。從數(shù)據(jù)組織能力角度,我們可以預(yù)設(shè)定量的數(shù)據(jù)關(guān)系,從IT架構(gòu)上去考慮其數(shù)據(jù)的關(guān)聯(lián)性,從信號(hào)源、操作者等特性組織數(shù)據(jù),建立基本的關(guān)系圖譜來(lái)保障數(shù)據(jù)在其生態(tài)環(huán)境中的基本生態(tài)地位。

          作者:姜振華 張曉磊 單位:浪潮軟件股份有限公司

        【血緣關(guān)系數(shù)據(jù)的分析論文】相關(guān)文章:

        大數(shù)據(jù)自動(dòng)分析與數(shù)據(jù)挖掘探討的論文04-26

        基于數(shù)據(jù)抽取與訂閱實(shí)現(xiàn)數(shù)據(jù)共享分析及研究論文04-14

        財(cái)政支出數(shù)據(jù)分析論文06-12

        廣電網(wǎng)絡(luò)數(shù)據(jù)的分析論文06-26

        2018最新中醫(yī)數(shù)據(jù)分析論文06-14

        關(guān)于氣象雷達(dá)數(shù)據(jù)分析論文06-26

        我國(guó)的數(shù)據(jù)挖掘技術(shù)現(xiàn)狀分析論文04-28

        預(yù)防接種數(shù)據(jù)分析的論文04-10

        論文:大數(shù)據(jù)分析與應(yīng)用問(wèn)題研究06-12

        99热这里只有精品国产7_欧美色欲色综合色欲久久_中文字幕无码精品亚洲资源网久久_91热久久免费频精品无码
          1. <rp id="zsypk"></rp>