ORACLE对表批处理操作
--刪除表對象 select 'drop table '||segment_name from dba_segments where owner='VPMUSER' and segment_type='TABLE'; --創建表對象 select? 'create table '||segment_name || ' as select * from '||segment_name ||'@DBLINK'? from dba_segments where owner='VPMUSER' and segment_type='TABLE';
檢查表是否完整導入 select segment_name from dba_segments@aaa where owner='VPMUSER' and segment_type='TABLE' ? and (segment_name not like 'BIN$%' and segment_name not like '%201%') minus select segment_name from dba_segments where owner='VPMUSER' and segment_type='TABLE' ?and segment_name not like 'BIN$%'
如何加速Oracle大批量數據處理?
一、提高DML操作的辦法:
簡單說來:
1、暫停索引,更新后恢復.避免在更新的過程中涉及到索引的重建.
2、批量更新,每更新一些記錄后及時進行提交動作.避免大量占用回滾段和或臨時表空間.
3、創建一臨時的大的表空間用來應對這些更新動作.
4、批量更新,每更新一些記錄后及時進行提交動作.避免大量占用回滾段和或臨時表空間.
5、創建一臨時的大的表空間用來應對這些更新動作.
6、加大排序緩沖區
alter session set sort_area_size=100000000;
insert into tableb select * from tablea;
commit;
如果UPDATE的是索引字段,就會涉及到索引的重建,暫停索引不會提高多少的速度,反而有可能降低UPDATE速度,
因為在更新是索引可以提高數據的查詢速度,重建索引引起的速度降低影響不大。
ORACLE優化修改參數最多也只能把性能提高15%,大部分都是SQL語句的優化!
update總體來說比insert要慢 :
幾點建議:
1、如果更新的數據量接近整個表,就不應該使用index而應該采用全表掃描
2、減少不必要的index,因為update表通常需要update index
3、如果你的服務器有多個cpu,采用parellel hint,可以大幅度的提高效率
另外,建表的參數非常重要,對于更新非常頻繁的表,建議加大PCTFREE的值,以保證數據塊中有足夠的空間用于UPDATE, 從而降低CHAINED_ROWS。
二、各種批量DML操作:
(1)、oracle批量拷貝:
set arraysize 20
set copycommit 5000
copy from username/password@oraclename append table_name1
using select * from table_name2;
(2)、常規插入方式:
insert into t1 select * from t;
為了提高速度可以使用下面方法,來減少插入過程中產生的日志:
alter table t1 nologging;
insert into t1 select * from t;
commit;
(3)、CTAS方式:
create table t1
as
select * from t;
為了提高速度可以使用下面方法,來減少插入過程中產生的日志,并且可以制定并行度:
create table t1 nologging parallel(degree 2) as select * from t;
?
(4)、Direct-Path插入:
insert /*+append*/ into t1 select * from t;
commit;
為了提高速度可以使用下面方法,來減少插入過程中產生的日志:
alter table t1 nologging;
insert /*+append*/ into t1 select * from t;
Direct-Path插入特點:
1、 append只在insert … select …中起作用,像insert /*+ append */ into t values(…)這類的語句是不起作用的。在update、delete操作中,append也不起作用。
2、 Direct-Path會使數據庫不記錄直接路徑導入的數據的重做日志,會對恢復帶來麻煩。
3、 Direct-Path直接在表段的高水位線以上的空白數據塊中寫數據,不會重用高水位線以下的空間,會對空間的使用造成一定的浪費,對查詢的性能也會造成一定的影響。而常規插入會優先考慮使用高水位線之下有空閑空間存在的數據塊。因此理論上Direct-Path插入會比常規插入速度更快,因為Direct-Path直接使用新數據塊,而常規插入要遍歷freelist獲取可用空閑數據塊,如果同 nologging 配合,這種速度優勢會更加明顯。
4、 以append方式插入記錄后,要執行commit,才能對表進行查詢。否則會出現錯誤:ORA-12838: 無法在并行模式下修改之后讀/修改對象。
5、 用append導入數據后,如果沒有提交或者回滾,在其他會話中任何對該表的DML都會被阻塞(不會報錯),但對該表的查詢可以正常執行。
6、 在歸檔模式下,要把表設置為nologging,然后以append方式批量添加記錄,才會顯著減少redo數量。在非歸檔模式下,不必設置表的 nologging屬性,即可減少redo數量。如果表上有索引,則append方式批量添加記錄,不會減少索引上產生的redo數量,索引上的redo 數量可能比表的redo數量還要大。
7、 數據直接插入數據文件,繞過buffer cache并且忽略了引用完整性約束。
8、 不管表是否在nologging 下,只要是 direct? insert,就不會對數據內容生成undo。
9、 Oracle在Direct-Path INSERT 操作末尾,對具有索引的表執行索引維護,這樣就避免了在drop掉索引后,再rebuild。
10、Direct-Path INSERT比常規的插入需要更多的空間。因為它將數據插入在高水位之上。并行插入非分區表需要更多的空間,因為它需要為每一個并行線程創建臨時段。
11、在插入期間,數據庫在表上獲得排他鎖,用戶不能在表上執行并行插入、更新或者刪除操作,并行的索引創建和build也不被允許。但卻可以并行查詢,但查詢返回的是插入之前的結果集。
(5)、并行DML:
如果你的服務器有多個cpu,采用parellel hint,可以大幅度的提高效率
ALTER SESSION ENABLE PARALLEL DML;
INSERT /*+ PARALLEL(tableA, 2) */INTO tableA
SELECT * FROM tableB;
為了提高速度可以使用下面方法,來減少插入過程中產生的日志:
INSERT /*+ PARALLEL(tableA, 2) */INTO tableA NOLOGGING
SELECT * FROM tableB;
oracle默認并不會打開PDML,對DML語句必須手工啟用。即需要執行
alter table enable parallel dml命令。
并行DML特點:
1、在并行DML模式中,默認的就是DIRECT-PATH插入,為了運行并行DML模式,必須滿足以下條件:
a、必須是Oracle企業版;
b、必須在session中使并行DML生效,執行以下sql語句:
ALTER SESSION { ENABLE | FORCE } PARALLEL DML;
c、必須指定table的并行屬性,在創建的時候或者其他時候,或者在insert操作時使用“PARALLEL”提示。
d、為了使Direct-Path Insert模式失效,在INSERT語句中指定“NOAPPEND”提示,覆蓋并行DML模式。
2、并行Direct-Path INSERT到分區表:
類似于serial Direct-Path INSERT,每個并行操作分配給一個或者多個分區,每個并行操作插入數據到各自的分區段的高水位標志之上,commit之后,用戶就能看到更新的數據。
3、并行Direct-Path INSERT到非分區表:
每個并行執行分配一個新的臨時段,并插入數據到臨時段。當commit運行后,并行執行協調者合并新的臨時段到主表段,用戶就能看到更新的數據。
4、Direct-Path INSERT可以使用Log或者不使用Log。
5、另外不得不說的是,并行不是一個可擴展的特性,只有在數據倉庫或作為DBA等少數人的工具在批量數據操作時利于充分利用資源,而在OLTP環境下使用并行需要非常謹慎。事實上PDML還是有比較多的限制的,例如不支持觸發器,引用約束,高級復制和分布式事務等特性,同時也會帶來額外的空間占用,PDDL同 樣是如此。
轉載于:https://my.oschina.net/u/229524/blog/49105
總結
以上是生活随笔為你收集整理的ORACLE对表批处理操作的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python wheel是什么意思_py
- 下一篇: php访问微信云数据库,第三方服务器ph